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Einleitung 


Längst wird in den Geisteswissenschaften eine Vielzahl von Projekten be- 
trieben, die sich mit Digitalisierung im weitesten Sinne befassen. Heute 
geht es nicht mehr darum, eine einzelne Datenbank ‚im stillen Kämmer- 
lein aufzubauen, größere, überregionale und über das World Wide Web 
abfragbare Lösungen werden gesucht und zum Teil schon realisiert. Mehr 
denn je vermisst man jedoch eine Standardisierung, die den dringend not- 
wendigen Austausch erleichtern und die gemeinsame Nutzung strukturier- 
ter Daten ermöglichen oder vorantreiben kann. Dazu bedarf es des Aus- 
tauschs und gemeinsamer Arbeitsansätze. 

Vor diesem Hintergrund fand am 10. und 11. April 2006 am Staatsarchiv 
der Freien und Hansestadt Hamburg eine gemeinsam mit dem Zentrum 
‚Geisteswissenschaften in der digitalen Welt‘ der Universität Hamburg ver- 
anstaltete Tagung statt, deren Hauptziel darin bestand, zumindest in eini- 
gen Bereichen eine Annäherung im Sinne kompatibler Strukturen und 
Denkansätze zu erreichen. Grundlage dafür war der intensive, interdiszi- 
plinäre Austausch, der in zweifacher Hinsicht übergreifend geschah, und 
zwar 


— inhaltlich: über die Epochen hinweg, und 
— formal: in Bezug auf verschiedene Überlieferungsträger (Wissenschaft, 
Archiv und Verwaltung). 


Bewusst wurden damit diejenigen, die Wissensarchive aufbauen und pfle- 
gen, mit denen, die diese im Rahmen ihrer Forschungen analysieren, in ei- 
nem intensiven Dialog zusammengeführt. Das erschien insofern besonders 
wichtig, als ein derartiger Schritt bei den bisherigen Diskussionen um die 
Forschung und die Sicherung von Wissen in einer immer stärker vernetz- 
ten und digitalisierten Welt über die formalen Grenzen hinweg so noch 
nicht vollzogen wurde. So konnten gemeinsam, aus der Sicht beider ‚Sei- 
ten‘, Probleme aufgezeigt und Perspektiven entwickelt werden. 


8 Einleitung 


Dabei stand im Rahmen der Tagung gerade nicht das Generieren techni- 
scher Einzellösungen im Vordergrund, sondern vielmehr die Entwicklung 
langfristiger Konzepte für die Aufbereitung und Sicherung von Wissensbe- 
ständen unterschiedlicher Couleur mit digitalen Methoden. Insbesondere 
der interdisziplinäre Ansatz und die Kooperation von Wissenschaft und 
Archiv erbrachten weiter führende Ergebnisse und werden dazu beitragen, 
dass ‚das Rad nicht immer wieder neu erfunden‘ werden muss. So konnten 
Desiderate und Konzepte jenseits der rein technischen und damit sehr 
stark zeitgebundenen Lösungsmodelle ausgelotet werden. 

Bewusst wurde daher auf interdisziplinäre Kooperation gesetzt. So wa- 
ren die Disziplinen 


— Archivwissenschaft, 

— Informatik, 

— Archäologie, 

— Geschichtswissenschaften und 
- Philologie 


auf die eine oder andere Weise in das Konzept eingebunden. Bei den Über- 
legungen zur Nutzung digitaler Methoden ging es jeweils auch um reflek- 
tierte Langzeitlösungen. Der vorliegende Band legt - bewusst zeitnah - die 
Beiträge der Tagung im Druck vor, damit die Diskussion der Probleme auf 
neuer Grundlage weitergehen kann. 

Der erste Teil der Beiträge ist Grundsatzfragen und grundlegenden me- 
thodischen Ansätzen gewidmet. Manfred Thaller setzt sich mit den Konse- 
quenzen der Digitalisierung für die Geschichtswissenschaft auseinander, 
Patrick Sahle analysiert Modelle für die digitale Erfassung und Erschlie- 
ßung historischer Dokumente, und Markus Heller und Georg Vogeler stel- 
len sowohl theoretische wie konkrete Konzepte für die Indexierung von 
Dokumenten vor. Im Anschluss daran werden im zweiten Teil des Bandes 
Projekte und Problemlösungen aus den verschiedenen Epochen der Ge- 
schichtswissenschaft diskutiert. Christoph Schäfer behandelt am Beispiel 
der Alten Geschichte Modelle für Wissenstransfer durch Visualisierung, 
Jürgen Sarnowsky, Andreas Kuczera und Dieter Rübsamen präsentieren 
ausgewählte Urkundenprojekte zur mittelalterlichen Geschichte, Bernd 
Schildt und Thomas Stäcker führen anhand frühneuzeitlicher Quellen in 
Konzepte datenbankgestützter Grundlagenforschung sowie in Digitalisie- 
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rungsprojekte ein. Der dritte Teil der Beiträge gilt schließlich den Chancen 
und Problemen des elektronischen Zugriffs auf Quellen- bzw. Archivbe- 
stände aus archivarischer Sicht. Rainer Hering arbeitet die Probleme digita- 
ler Überlieferung der Behörden heraus, Dieter Heckmann macht an einem 
konkreten Beispiel Stand und Perspektiven der Digitalisierung von Archiv- 
materialien deutlich, und Frank M. Bischoff und Udo Schäfer stellen die 
Planungen für ein deutsches Archivportal vor. Den Abschluss bildet die 
Zusammenfassung von Angelika Schaser, die weiter führende Fragestel- 
lungen entwickelt. 

Die Herausgeber danken der Thyssen-Stiftung für die großzügige För- 
derung der Tagung sowie Hamburg University Press für die vorzügliche 
Betreuung des Bandes. 


Die Herausgeber 


Grußwort 


Karin von Welck 


Sehr geehrte Damen und Herren, 
sehr geehrter Herr Professor Thaller, 


ich freue mich sehr, Sie alle im Staatsarchiv der Freien und Hansestadt Ham- 
burg zu der Tagung Forschung in der digitalen Welt begrüßen zu dürfen. Vor 
zwei Jahren fand in diesem Raum, dem Lorichssaal, die Tagung Digitales Ver- 
walten — Digitales Archivieren statt, deren Ergebnisse in den Veröffentlichun- 
gen aus dem Staatsarchiv der Freien und Hansestadt Hamburg publiziert 
worden sind. Damals ging es um die Schnittstelle zwischen Verwaltung und 
Archiv. Heute und morgen wird es auch um die Schnittstelle zwischen Ar- 
chiv und Forschung, vor allem aber um die Nutzung von Datenbanken und 
Internet durch die historische Forschung gehen. Für die teilnehmenden Ar- 
chivarinnen und Archivare wird - denke ich jedenfalls - von besonderem In- 
teresse sein, wie die moderne Forschung mit den sich bietenden technischen 
Möglichkeiten arbeitet und welche Erwartungen der Forschung an die Archi- 
ve sich aus diesen Arbeitsformen heraus entwickeln oder entwickeln können. 
Der für die Tagung gewählte interdisziplinäre Ansatz wird sich deshalb - da- 
von bin ich überzeugt - als besonders fruchtbar erweisen. 

Man könnte denken, das ‚Digitale‘ würde nun zum gemeinsamen Nen- 
ner der Tagungen, die das Staatsarchiv durchführt. Es war jedoch eher der 
interdisziplinäre Ansatz, der das Staatsarchiv veranlasste, gemeinsam mit 
dem Zentrum ‚Geisteswissenschaften in der digitalen Welt‘ diese Veranstal- 
tung zu planen. Da Herr Professor Sarnowsky bereits seit längerem zusam- 
men mit dem Staatsarchiv an dem Projekt eines Virtuellen Hamburgischen 
Urkundenbuchs arbeitet, bot sich diese Kooperation geradezu an. Im Rah- 
men seiner Möglichkeiten wird das Staatsarchiv den Studierenden der vom 
Zentrum angebotenen Studiengänge auch Praktika ermöglichen. Dieses 
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Engagement für die Ausbildung freut mich natürlich ganz besonders. Das 
Staatsarchiv wird den interdisziplinären Ansatz auch in Zukunft weiter 
verfolgen. Als Amt der Kulturbehörde hat es ein sehr breites Aufgaben- 
spektrum, so dass sehr unterschiedliche Partner denkbar sind: Nicht nur 
Museen und Bibliotheken, nicht nur die historischen Wissenschaften, son- 
dern auch die Rechtswissenschaft oder - man denke an die vielen in die- 
sem Haus verwahrten Karten und Pläne - die Geowissenschaften kommen 
hier in Betracht. Ich begrüße es sehr, dass das Staatsarchiv von Zeit zu Zeit 
versuchen wird, in Kooperation mit anderen Einrichtungen Gastgeber ei- 
nes interdisziplinären Austauschs zu sein. 

‚Digitale Bibliotheken‘, ‚digitale Archive‘: Diese Themen sind mittlerweile 
auch in der Politik angekommen. Im letzten Jahr hat die Europäische Kom- 
mission dem Rat und dem Europäischen Parlament eine Mitteilung vorge- 
legt, in der sie sich intensiv mit der Online-Verfügbarkeit des europäischen 
Kulturerbes beschäftigt, wobei ich sehr froh bin, dass die Kommission ihr 
Augenmerk nicht nur auf das Thema dieser Tagung, nämlich die Zugäng- 
lichkeit, richtet, sondern sich auch mit der langfristigen Bewahrung des digi- 
talen Kulturerbes befasst. Mit dieser Mitteilung und anderen sich auf die 
Digitalisierung von Kulturgut beziehenden Themen hat sich auch der Kul- 
turausschuss der Kultusministerkonferenz in seiner letzten Sitzung vor we- 
nigen Wochen beschäftigt. Sie sehen, das Thema gewinnt auch auf der politi- 
schen Ebene an Fahrt. Die Frage nach einer nationalen Digitalisierungsstrate- 
gie steht auf der Tagesordnung. Allerdings ist deren Verwirklichung nicht 
ohne erhebliche finanzielle Mittel denkbar. Als Mitglied einer Landesregie- 
rung weiß ich nur zu gut um die Situation der öffentlichen Haushalte 
Bescheid. Ob alternative Wege zur Finanzierung möglich sind, bleibt abzu- 
warten. Eines muss aber auf jeden Fall erreicht werden: die enge Koopera- 
tion zwischen Bund und Ländern, zwischen Bibliotheken, Archiven, Museen 
und anderen Kulturgut sichernden Einrichtungen sowie mit der Deutschen 
Forschungsgemeinschaft und anderen die Wissenschaft fördernden Gesell- 
schaften. In unserem föderalen System ist dieses keine leichte, aber eine loh- 
nende, die kulturelle Vielfalt auch in der digitalen Welt bewahrende Aufgabe. 

Ich wünsche Ihnen allen eine interessante und ertragreiche Tagung. So- 
weit Sie von auswärts kommen, bleibt Ihnen vielleicht am Dienstag noch 
ein wenig Zeit, unser wunderschönes Hamburg zu genießen oder wenigs- 
tens in der Nähe des Hauptbahnhofs einen Blick in die Kunsthalle oder das 
Museum für Kunst und Gewerbe zu werfen. 


„Wie ist es eigentlich gewesen, wenn das Gedächtnis 
virtuell wird?“ 


Die historischen Fächer und die digitalen Informations- 
systeme 


Manfred Thaller 


1. Umfeld 


Rankes scheinbar bescheidener Satz „Man hat der Historie das Amt, die 
Vergangenheit zu richten, die Mitwelt zum Nutzen zukünftiger Jahre zu 
belehren, beigemessen: so hoher Ämter unterwindet sich gegenwärtiger 
Versuch nicht: er will blos zeigen wie es eigentlich gewesen.“' ist wohl auch 
heute noch ein guter Ausgangspunkt für die Bewertung der Relevanz 
neuerer Entwicklungen für die historischen Disziplinen. Nicht weil man 
ihn als Ausdruck naiven Objektivitätsglaubens unkritisch übernehmen 
muss; gerade für die Kritik des sich in ihm darstellenden Objektivitätsglau- 
bens stellt er einen vorzüglichen Ausgangspunkt dar. Aber mindestens des- 
halb, weil er in seiner scheinbaren Bescheidenheit doch Ausdruck einer 
sich selbst als geschlossen und konsistent sehenden Historischen Wissen- 
schaft ist, was man der heutigen defensiven Debatte um die anhaltende 
oder sich verlierende Bedeutung der historischen Disziplinen nur wün- 
schen kann. Ein guter Ausgangspunkt ist der Satz gerade auch deshalb, 
weil er in anderen Wissenschaftslandschaften noch immer als spezifisch 
deutsch gilt - so, wenn in den 90er Jahren ein amerikanischer Versuch, den 


1 Leopold von Ranke: Vorwort zur ersten Ausgabe (1924) der Geschichte der Romanischen und 
Germanischen Völker. Leipzig ’1885. VI. 
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deutschen Stand des Rechnereinsatzes in den historischen Disziplinen un- 
ter dem Titel Counting ‚How it Really Was” veröffentlicht wurde. 

Das Umfeld historischer Forschung ändert sich ständig; eine der Ände- 
rungen, denen es eben jetzt, im Jahre 2006, unterliegt, besteht darin, dass 
der ‚Rohstoff‘ historischer Forschung, als die ungedruckten und gedruck- 
ten Quellen, unverhältnismäßig leichter zugänglich werden könnte, als er 
dies bisher war, wenn man einige vollkommen unabhängig von den histo- 
rischen Disziplinen entstandenen Trends fortschreibt. Wir sprechen dabei 
von der systematischen Bereitstellung von Digitalisaten von Bibliotheks- 
und Archivbeständen, die national und international innerhalb zu einem 
Zeitpunkt vorangetrieben wird, zu dem die Vorstellung, dass die neuen 
Möglichkeiten des digitalen Informationsaustausches und der Vernetzung 
von Information, den für ihre Analyse benötigten Werkzeugen zusammen 
mit neuen Publikationswegen eine ganz allgemein ‚verbesserte‘ Art der 
Forschung ermöglichten, was sich hinter dem forschungspolitisch wichti- 
gen Schlagwort der E-Science verbirgt (wobei ‚E‘ für enhanced steht)’. Aus 
dieser Vorstellung entwickelt sich in anderen Ländern mittlerweile ein 
Konzept der ‚E-Humanities‘, rund um die Vorstellung einer Geisteswissen- 
schaft, die die digitalen Medien langfristig als primäres Mittel für den Zu- 
gang zu Forschungsinformation, deren Analyse und der Veröffentlichung 
der so erzielten Ergebnisse nutzen könnte. Dies kann, recht stark verengt, 
durch einen Schwerpunkt auf der Untersuchung der Konsequenzen durch 
ein Forschungsprogramm geschehen (wie in den Niederlanden)‘, durch die 
weitere Neufokussierung des seit mehreren Jahren betriebenen Neuauf- 
baus einer IT Infrastruktur für die Geisteswissenschaften (wie in Großbri- 
tannien)’ oder durch nationale Vorstudien für eine ‚Cyberinfrastruktur‘ für 
die Geisteswissenschaften (wie derzeit in den USA)‘. 


? E, A. Johnson: Counting ‚How It Really Was’: Quantitative History in West Germany. In: Histo- 
rical Methods Newsletter 21 (1988). S. 63. 


° Vgl. Wissenschaftsmanagement - Zeitschrift für Innovation, Special 1/2005 „Management im 
virtuellen Forschungsraum“. 


4 Adresse: http://www.virtualknowledgestudio.nl (letzte Einsichtnahme am 19.06.2006; zu die- 
sem Datum wurde auch die Sichtbarkeit aller weiteren angeführten URLs geprüft). 


5 Vgl. http://www.ahrb.ac.uk/; eine absehbar langfristig verfügbare Beschreibung der derzeitigen 
Programme kann nicht angegeben werden. 


é Vgl. http://www.acls.org/cyberinfrastructure/cyber.htm. 
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Konkreter als diese weitgreifenden Planungen, die vielleicht so weit 
greifen, dass sie niemals konkrete Formen annehmen ist, dass in den letz- 
ten Jahren erhebliche Mengen von digitalisierten Bibliotheks- und Archiv- 
materialien verfügbar gemacht worden sind - in Deutschland etwa durch 
ein einschlägiges Förderprogramm der DFG, das in einer ersten Förderpha- 
se bis 2003 etwa 90 Projekte gefördert hat, die Quellen eines sehr breiten 
Spektrums, von antiken Papyri bis zu Materialien zur Geschichte der DDR, 
bereitgestellt haben.’ Trotz mancher Probleme im Detail waren die Erfah- 
rungen damit hinreichend überzeugend, dass die weitere Förderung so 
ausgerichtet werden wird, dass von der Digitalisierung einzelner Objekte 
zur Digitalisierung ganzer Bestände übergegangen wird”, wobei das strate- 
gische Ziel, sämtliche Drucke des 16. und 17. Jahrhunderts, die in den deut- 
schen nationalbibliographischen Verzeichnissen deutscher Drucke zu die- 
sen Jahrhunderten enthalten sind, zu digitalisieren, mittlerweile durch eine 
erste Ausschreibung für einschlägige Projekte konkretisiert wurde. 

Andere Erfahrungen im Bereich der systematischer Digitalisierung führ- 
ten schließlich Ende 2004 zur Absichtserklärung von Google, in Zusam- 
menarbeit mit einigen großen Bibliotheken systematisch Druckwerke im 
Umfang von einigen Millionen Bänden digital bereit zu stellen.’ Dieses Pro- 
jekt als solches ist überschattet von einer gewissen Unklarheit der tatsächli- 
chen Ziele; für den europäischen Bereich wichtiger ist wohl, dass diese An- 
kündigung vor allem - aber nicht nur — durch den Direktor der Biblio- 
thèque National de France, Jean-Noël Jeanneney, als Herausforderung an 
die kulturelle Präsenz Europas im Internet dargestellt wurde.” Während 
Bestrebungen zur systematischen Digitalisierung des kulturellen Erbes bis- 
her vor allem in Kreisen von Bibliothekaren und Archivaren diskutiert 
wurden, genießen sie seit kurzem hohe politische Aufmerksamkeit — und 
die europäische Kommission hat angekündigt in den nächsten fünf Jahren 
ab 2006 mindestens fünf Millionen „Bücher und andere Dokumente” öf- 
fentlich bereitzustellen. 


7 Vgl. den vom Verfasser redigierten Evaluierungsbericht über dieses Förderprogramm: 
http://www.dfg.de/forschungsfoerderung/wissenschaftliche_infrastruktur/lis/download/retro_ 
digitalisierung_eval_050406.pdf. 


ê Vgl. das einschlägige Strategiepapier der DFG unter http://www.dfg.de/forschungsfoerderung/ 
wissenschaftliche_infrastruktur/lis/download/pos_papier_kulturelle_ueberlieferung_0511.pdf. 


° Vgl. http://books.google.com/ zum aktuellen Angebot. 


1 Jean-Noël Jeanneney: Googles Herausforderung. Für eine europäische Bibliothek. Berlin 2006. 
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Kleinere Beiträge zu diesem Bemühen um die systematische Bereitstel- 
lung digitalisierter Quelleninformationen stammen auch vom Verfasser: 
Beginnend mit der Bereitstellung eines geschlossenen Bestandes aus dem 
Stadtarchiv Duderstadt in den 90er Jahren", fortgesetzt durch die digitale 
Umwandlung der Codices der Kölner Diözesan und Dombibliothek'” und 
zuletzt weitergetrieben durch ein Projekt zur systematischen Digitalisie- 
rung von Inkunabeln” einerseits, das nachweisen sollte, dass eine gezielte, 
flächendeckende Digitalisierung der deutschen Inkunabeln realisierbar 
wäre, andererseits durch eine größere Anzahl von Kleinprojekten, die zei- 
gen sollten, dass derartige Digitalisierungsprojekte bereits mit geringen 
Mitteln durchgeführt werden können.' Beschreibungen dieser Projekte 
sind in letzter Zeit mehrfach im Druck erschienen”; sie sollen hier daher 
nicht wiederholt werden. 


2. Konsequenzen für die Historischen Fächer und die von 
ihnen genutzten Infrastrukturen“ 


Vor diesem Hintergrund ist gegenwärtig eine Art stiller Diskussion über 
die Frage, was den eigentlichen Nutzen dieser von mancher Seite lebhaft 
propagierten neuen digitalen Technologien innerhalb des Bereichs der 
Geistes- und Kulturwissenschaften ausmache, entstanden. Mit ‚stiller Dis- 


1 Manfred Thaller und Hans-Heinrich Ebeling: Digitale Archive. Die Erschließung und Digitali- 
sierung des Stadtarchivs Duderstadt. Göttingen 1999 (vgl. http://www.archive.geschichte.mpg. 
de/duderstadt/). 


" Adresse: http://www.ceec.uni-koeln.de. 
® Adresse: http;//inkunabeln.ub.uni-koeln.de. 
"Vgl. dazu die Projektübersicht unter http://www.hki.uni-koeln.de/projekte/projekte-b.html. 


15 Manfred Thaller: Digital manuscripts as base line for digital editions. In: Digital Technology 
and Philological Disciplines. Hg. von Andrea Bozzi, Laura Cignoni, Jean-Louis Lebrave (Lingu- 
istica Computazionale 20/21). Pisa, Rom 2004. S 489-511. - Ders.: Reproduktion, Erschließung, 
Edition, Interpretation: Ihre Beziehungen in einer digitalen Welt. In: Vom Nutzen des Edierens. 
Hg. von Brigitte Merta, Andrea Sommerlechner und Herwig Weigl (Mitteilungen des Instituts 
für Österreichische Geschichtsforschung Ergänzungsband 47). Wien 2005. S. 205-227. - Ders.: 
Alte Archive - Neue Technologien. In: Alte Archive - Neue Technologien. Hg. von Thomas Aig- 
ner. Wien 2006 (im Druck). 


1 Dieser und der folgende Abschnitt wiederholen Positionen, die bereits im in der vorigen An- 
merkung zitierten Aufsatz des Verfassers „Reproduktion, Erschließung, Edition, Interpreta- 
tion ...” ausgearbeitet wurden. Die Darstellung wurde großteils unverändert übernommen. 
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kussion’ meinen wir, dass sehr unterschiedliche Positionen existieren, die 
jedoch in der Regel nicht explizit gemacht, noch weniger verschriftlicht 
werden, sondern meist aus programmatischen Erklärungen zum Nutzen 
(oder der Bedrohlichkeit) der neuen Informationstechnologien für die Be- 
reitstellung historischen Quellenmaterials erschlossen werden müssen. 

Bevor wir solche Positionen einander gegenüberstellen, möchte ich zu- 
nächst herausstellen, was meiner Meinung nach die wirklich entscheidende 
Änderung bei den Voraussetzungen für die Publikation von Quellen in den 
letzten Jahren ist. Und auch wenn ich zögere, das Wort ‚Revolutionen’ zu 
verwenden, gerade weil bestimmte Bereiche der Medienwissenschaft gera- 
dezu ständig damit beschäftigt sind, immer neue ‚Medienrevolutionen‘ zu 
entdecken, so glaube ich doch, dass es eine ganz bestimmte technologische 
Änderung in unseren Arbeitsbedingungen gibt, die langfristig extrem gra- 
vierende Auswirkungen haben wird. Dabei geht es um folgendes Phäno- 
men: 

Seit den frühesten Versuchen der Menschheit, Information zu bewahren 
und/oder sie zu vervielfältigen und zu vermitteln, galt eine unumstößliche 
Regel: Sogar die beste und sorgfältigste verbale Beschreibung eines Objekts 
war immer billiger als jede auch nur einigermaßen befriedigende visuelle 
Reproduktion. Dies ist ganz offensichtlich so für die Antike, in der wirklich 
detailgenaue Abbildungen kaum möglich waren, aber selbst nach der Er- 
findung der Photographie behielt diese Regel bis vor kurzem ihre Gültig- 
keit. Man vergleiche bis in die allerjüngste Zeit den Preis reich illustrierter, 
aber nicht weiter komplex strukturierter kunsthistorischer Bildbände und 
extrem sorgfältig redigierter, aber bildarmer Texteditionen. Aus dieser kul- 
turellen/technologischen/ökonomischen Voraussetzung entstand eine Tra- 
dition des Umgangs mit Quellen, die die Annahme widerspiegelt, dass die 
textuelle Wiedergabe wesentlich leichter finanzierbar ist als die visuelle Re- 
produktion. Es galt immer die Regel: 


- Fasse die weniger wichtigen Texte zusammen (Regesta). 
- Veröffentliche die wichtigsten von ihnen kritisch (Editio critica). 
— Reproduziere ausgewählte Einzelstücke visuell (Facsimile). 


Mit modernen digitalen Technologien trifft, wie wir oben hergeleitet haben, 
die Grundannahme ‚Beschreibung ist billiger als Reproduktion‘ nicht mehr 
länger zu. Die visuelle Erscheinung eines Textes, oder von extrem großen 
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Textmengen, zu reproduzieren ist sehr viel billiger als diese Texte zu tran- 
skribieren, zusammenzufassen, zu edieren, mit anderen Worten: zu be- 
schreiben. Sogar wenn wir „nur“ über Zusammenfassungen in der Tradi- 
tion von Regesten sprechen, ist es ganz klar, dass kein Textcorpus für 50 
Cent bis 1 Euro pro Ausgangsseite regestierbar ist. 

Wenn diese Annahme nicht mehr stimmt, was für Konsequenzen hat 
dies für unser Bestreben, Dokumente aus der Vergangenheit besser zu- 
gänglich zu machen? Spontan können wir feststellen, dass es jederzeit 
möglich wäre, die für die gesamte historische Forschung zugänglichen Do- 
kumente - die also für darüber stattfindende Debatten allen daran Teilneh- 
menden auch wirklich zugänglich sind - mit relativ geringen Mitteln extrem 
auszuweiten, wenn wir davon ausgehen, dass wir Dokumente, die wir sofort 
zu Gesicht bekommen, mit sehr viel spärlicheren Angaben beschreiben kön- 
nen als solche, bei denen die Güte der Beschreibung letzten Endes als Grund- 
lage der Entscheidung dienen muss, ob sich die beträchtlichen Kosten des 
unter Umständen mit einer Reise verbundenen Zugriffs auf das Original loh- 
nen. Wie wir diese Aussage bewerten, hängt letztlich von der Position ab, die 
der Einzelne in der oben erwähnten stillen Diskussion einnimmt. 

Eine dieser Positionen kann etwa folgendermaßen explizit gemacht werden: 
Bloß weil sich die Technik der Publikation ändert, ändert sich noch lange 
nichts an der methodischen und intellektuellen Situation des Herausgebers. 
Moderne Technologien sollten deshalb genutzt werden, um den traditionellen 
Arbeitsprozess zu optimieren. Dies hat vier wichtige Konsequenzen: 


—- Die Edition in einer digitalen Umwelt sollte so nah wie möglich das ge- 
druckte Paradigma wiedergeben. Dies impliziert auch, dass mehrere 
kritische Apparate am Bildschirm genauso zu reproduzieren sind wie 
auf einer gedruckten Seite. 

-— Was bisher am publikationswürdigsten war, bleibt es. Die bisher als 
wichtigste Quellen betrachteten Dokumente sollten auch die ersten 
sein, die mit den neuen Technologien publiziert werden. (optimierter 
Zugang zu einem kanonischen Corpus). Das wichtigste Dokument in 
der Geschichte eines Landes bleibt stets der erste Kandidat für die An- 
wendung neuer Reproduktionsmöglichkeiten: als Erstes im Druck 
ediert, als Erstes lithographisch wiedergeben, Pilotobjekt für die ver- 
schiedenen Generationen photographischer Technik. Konsequenterwei- 
se nimmt die Magna Carta eine prominente Stelle auf den Seiten der 
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British Library ein und die Gutenberg-Bibel ist bereits mehrfach, man 
ist versucht zu sagen: vielfach, digitalisiert worden. 

- Ein Editor publiziert noch immer ein abgeschlossenes, bis in die letzte 
Einzelheit durchdachtes und auf sehr lange Zeit angelegtes Werk, für 
das er oder sie allein verantwortlich ist. Diese Verantwortung zwingt 
zu äußerster Sorgfalt: Eine Edition ist als Ganzes erst verfügbar, wenn 
der Editor überzeugt ist, dass sie so perfekt ist, wie sie dies nach 
menschlichem Vermögen sein kann. 

- Bibliothekar und Archivar sind die Wächter ihrer Bestände. Sie kontrol- 
lieren den Zugang zu den Quellen. Nur wenn Material gemäß dem 
neusten Stand der relevanten Wissenschaft erschlossen wurde, kann es 
einem Benutzer oder einer Benutzerin anvertraut werden, sei es digital, 
sei es physisches Original. 


Lassen Sie mich betonen, dass ich diese Meinung für in sich konsistent, lo- 
gisch geschlossen und überaus ehrenwert und respektabel halte. Sie re- 
spektierend halte ich sie dennoch für falsch und plädiere dafür, unsere Vor- 
stellung vom Zugang zu historischen Dokumenten weiter zu entwickeln. 
Viele der Details, die sich aus diesem Vorschlag ergeben, werden noch in- 
tensiver Klärung bedürfen. Trotzdem würde ich behaupten, dass die folgen- 
de Position in sich eben so konsistent ist wie die eben vorgetragene. 

Das typographische Aussehen von Editionen ist nicht das Ergebnis eines 
bewussten teleologischen Prozesses: Es hat sich sukzessive aus dem Ver- 
such ergeben, das Beste aus den Bedingungen und Grenzen der Drucktech- 
nik zu machen. Genau wie die ersten gedruckten Bücher versuchten, wie 
Codices” auszusehen, lag es nahe, die ersten digitalen Publikationen nach 
dem Beispiel gedruckter Bücher zu gestalten; genau wie gedruckte Medien 
ihre eigene Form schließlich gefunden haben, sollten die digitalen Medien 
ihre eigene suchen." Der grundlegende Zweck der modernen Technologien 


Y Dass übrigens der Codex bereits selbst das Ergebnis einer Reihe von Konsequenzen „publikati- 
onstechnischer Erfindungen“ war, die das Verhältnis zum Text fundamental verändert haben, 
wird in Ivan Illichs viel zu wenig beachteter Studie zu Hugo von St. Victor sehr schön geschil- 
dert: Ivan Illich: In the Vineyard of the Text. A Commentary to Hugh’s Didascalicon. Chicago, 
London 1993. 


$ Vgl. als „Zustandsbericht“ Gesine Boesken: Lesen am Computer -— Mehrwert oder mehr Ver- 
wirrung? Untersuchungen zur „Konkurrenz“ zwischen Buch und Hypertext. In: Jahrbuch für 
Computerphilologie 4 (2002). S. 85-114; auch unter http://computerphilologie.uni-muenchen.de/ 
jg02/boesken.html. 
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innerhalb der editorischen Arbeit ist deshalb die Unterstützung eines wei- 
ter entwickelten Arbeitsprozesses. Dieser wird umso produktiver sein, 
wenn er die hervorstechenden Eigenschaften der neuen Technologien aus- 
nützt. Dazu gehört das Prinzip des Verteilten Arbeitens bei dem Material, 
zu dessen Bereitstellung viele zusammenwirken, wie im Falle der Inkuna- 
beln und dem digitalen Bildarchiv prometheus, wie ein integriertes Informa- 
tionsangebot aussieht. Dazu gehört das Prinzip des kooperativen Arbei- 
tens, das mehr Partner in den editorischen Prozess integriert als bisher. 
Dies führt zu den folgenden vier Gegenpositionen zu den eben genannten: 


- Die neuen Technologien sollten genutzt werden, um über das Bisherige 
hinausgehende, mit den bisherigen Techniken nicht gegebene Möglich- 
keiten zu schaffen.” Wird ein editorisches Interesse am besten durch 
eine gedruckte Edition bedient, sollte man sie drucken.” Digitale Tech- 
niken sollten dem vorbehalten bleiben, was mit dem Druck nicht zu er- 
reichen war. Beispielsweise sollte gezielt untersucht werden, ob es 
nicht Darstellungsweisen des Inhalts von kritischen Apparaten” gibt, 
die sich auf inhärent dynamischen Medien wie dem Bildschirm besser 
darstellen lassen als im Druck.” Wird die Verwandtschaft von zwanzig 
Zeugen in einem gedruckten Apparat wirklich transparent? 

— Was die editorischen Wissenschaften in den letzten Jahrzehnten auf der 
Ebene des hohen von ihnen erreichten fachlichen Standards und unter 
hervorragender Ausnutzung der Drucktechnologie publiziert haben, 
ist für die Fachwelt verfügbar. Dieses Material mit Hilfe der neuen 
Technologien nochmals zu veröffentlichen, verbessert seine Zugäng- 
lichkeit bestenfalls marginal. Dem entspricht der Standpunkt, dass die 
neuen Technologien bevorzugt zur Veröffentlichung jener Typen von 
Material verwendet werden sollten, die entweder wegen spezieller Ei- 


2 Vgl. Sören Steding: Warum noch Drucken? Über die Nachteile gedruckter Editionen. In: Jahr- 
buch für Computerphilologie 3 (2001). S. 149-159; auch unter http://computerphilologie.uni-mu- 
enchen.de/jg01/steding.html. 

2 Vgl. Dino Buzzetti: Diacritical ambiguity and Markup. In: Augmenting Comprehension (wie 
Anm. 7). S. 175-188, hier S. 175: „A digital edition can only be wholly justified if it is capable of 
providing viable solutions to problems that can poorly be faced in any other way“. 

a Oder, weniger oberflächlich, Konzepte von ‚Text‘, welche die durch Variantenapparate ausge- 
drückte Variabilität besser ausdrücken. Vgl. Dino Buzzetti: Rappresentazione digitale e modello 
del testo. In: Il ruolo del modello nella scienza e nel sapere (Contributi del Centro Linceo Interdi- 
sciplinare ‚Beniamino Segre“ 100). Roma 1999. S. 127-161. 


2 Vgl. Domenico Fiormonte: Scrittura e filologia nell'era digitale. Torino 2003. S. 209-237. 
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genschaften oder wegen ihrer schieren Menge durch die alten Techno- 
logien nicht veröffentlicht werden konnten. (Dekanonisierung der 
Quellenkunde.) Sowohl die Magna Carta als auch die Gutenberg-Bibel 
sind hervorragende Beispiele für die Art von Material, die nach Ansicht 
des Verfassers nicht - und ganz bestimmt nicht vorrangig - in die digi- 
tale Form überführt werden sollten. 

- Ein Herausgeber ist nach diesem Modell für eine wohl definierte Phase 
innerhalb eines länger andauernden Arbeitsprozesses verantwortlich, 
für den die wissenschaftliche Gemeinschaft als Ganzes verantwortlich 
ist. Das bedeutet, dass eine Edition als eine Serie aufeinander aufbau- 
ender Arbeitsgänge verstanden wird, die Schritt für Schritt Schichten 
zusätzlichen Wissens zur einfachen Reproduktion eines Stückes — oder 
einer Sammlung - hinzufügen. Die erste derartige Schicht besteht kon- 
zeptuell wirklich einfach in der raschen und kostengünstigen „nack- 
ten” Digitalisierung - die keinerlei intellektuelles Problem löst, das Do- 
kument aber aus seiner „Gefangenschaft“ im Archiv befreit und es der 
öffentlichen Diskussion zugänglich macht. Die erste Schicht könnte 
möglicherweise eine „nackte“ Digitalisierung sein, daran könnte sich 
als zweite Schicht ein sehr limitiertes Zugangssystem anschließen, das 
nicht mehr leistet als die Handhabung der Reproduktionen zu verein- 
fachen. Eine dritte Schicht könnte in einer akribischen, aber immer 
noch weitgehend mechanischen Transkription” bestehen, an die sich 
als vierte eine sorgfältige Kollation mit einem zweiten Textzeugen an- 
schließt”, die schließlich nach mehreren weiteren Schritten in eine kriti- 
sche Edition im ursprünglichen Sinne mündet. Eine sechste kann ein 
Kommentar eines Sprachhistoriker zu der hier als fünfte Schicht ange- 
sprochenen Edition sein, eine siebente deren inhaltliche Interpretation, 
und so weiter. 


3 Der Vollständigkeit halber sei darauf hingewiesen, dass eine vom Menschen unbeaufsichtigte 
automatische Transkription von Manuskriptmaterial in absehbarer Zeit nach wie vor unwahr- 
scheinlich ist. Für die technischen Ansätze dazu siehe Bianca Feldmann: OCR von Handschrif- 
ten. In: Codices Electronici Ecclesiae Coloniensis (wie Anm. 5), S. 107-143. Als Erfahrungsbericht 
über an mittelalterlichem Material getestete Ansätze: Computer-aided Recovery and Analysis of 
Damaged Text Documents. Hg. von Andrea Bozzi. Bologna 2000. 


2% Zum Einsatz der Informationstechnologie bei der Kollationierung und davon ausgehend bei 
der Erstellung von Stemmata vgl. Peter Robinson: Making Electronic Editions and the Fascinati- 
on of What is Difficult. In: Digital Technology (wie Anm. 2), S. 415-437. 
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-— Archivar und Bibliothekar sind nach diesem Modell mehr als für alles 
andere dafür verantwortlich, das Material verfügbar zu machen. Kata- 
loge und andere Werkzeuge der Erschließung der Bestände einer Ein- 
richtung sind Werkzeuge zu einem bestimmten Ziel; sie sind niemals 
Selbstzweck. Nie und nimmer darf das Argument, dass ein Dokument 
nicht gut genug katalogisiert, verzeichnet, erschlossen sei, ein Grund 
dafür sein, es der Forschung nicht zur Verfügung zu stellen - und 
wenn es nur auf der Basis einer mechanischen Reproduktion ist. 


Der für die meisten Leser dieser Sichtweise der Bedeutung der neuen Tech- 
nologien strittigste Standpunkt ist natürlich der, dass Editionen als ein ge- 
schichteter Prozess miteinander kooperierender Forscher und nicht das 
monolithische Opus Magnum eines Einzelnen verstanden werden sollten. 
Lassen Sie mich deshalb dieses Argument noch ein wenig weiter verfolgen, 
um deutlicher zu erklären, wie ich mir die Implementation eines solchen 
„editorischen Prozesses” vorstelle. 


3. Konsequenzen für das Verhältnis zu Quellen und Editionen 


„Die Edition“ einer Quelle kann gegenwärtig als eine Serie von Tätigkeiten 
angesehen werden, von denen jede abgeschlossen sein muss, bevor die 
nächste beginnt. Und jede von ihnen erzeugt Ergebnisse, die nicht mehr 
verändert werden können, sobald diese Tätigkeit beendet wurde. Dies 
führt zum folgenden Verständnis der Rollen” einzelner am Umgang mit 
historischen Quellen Beteiligter: 


(1 
(2 
(3 
(4 


Archivar oder Bibliothekarin bewahren das Dokument. 

Herausgeber oder Herausgeberin rekonstruieren dessen ‚wahren‘ Text. 
Forscher oder Forscherin interpretieren ihn. 

Leser oder Leserin werden durch diese Interpretation erleuchtet. 


Du Zi DZ ze 


® Zu einer stärker dem Handwerklichen verpflichteten Betrachtung der sich bei Verwendung 
der digitalen Medien ergebenden Änderungen für die Rolle des Herausgebers siehe Claire War- 
wick: „Rumours of my death have been greatly exaggerated“: Scholarly Editing in the Digital 
Age. In: New Media and the Humanities: Research and Applications. Hg. von Domenico Fior- 
monte und Jonathan Usher. Oxford 2001. S. 49-56. 
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Wichtig für unsere Argumentation ist dabei, wie schon erwähnt, dass jeder 
dieser Schritte voraussetzt, dass der vorherige abgeschlossen wurde, bevor 
man ihn tut, und dass er nicht zurückgenommen werden kann. Falls Leser 
oder Leserin sich durch eine historische Interpretation im Dunkeln gelas- 
sen fühlen, können sie sich brieflich beschweren: Selbst die brillanteste per- 
sönliche Beantwortung ihrer Fragen durch den Verfasser verbessert die 
Verständlichkeit des einmal geschriebenen Textes für Dritte jedoch nicht. 
Falls ein inhaltlich arbeitender Forscher auf der Basis seiner Kenntnisse des 
weiteren Entstehungskontextes gute Gründe findet, eine zentrale Lesung 
zu ändern, so hilft das ihm, die nächste Leserin sieht sich jedoch immer 
noch der unkorrigierten ursprünglichen Edition gegenüber. 

Der wesentliche Unterschied bei einer Edition, die als „Prozess“ verstan- 
den wird, ist, dass alle diese Schritte weitgehend unabhängig voneinander 
erfolgen,” also schon in dem Moment, in dem eine Quelle digital im globa- 
len Informationsangebot „sichtbar“ wird, beginnen können. Im folgenden 
gehen wir also davon aus, dass alle Aktivitäten (spätestens nachdem Archi- 
var oder Bibliothekarin ihre Tätigkeit beendet haben, aber durchaus auch 
schon, während sie sukzessive einen größeren Bestand bereitstellen) gleich- 
zeitig ablaufen. 


(1) Archivar oder Bibliothekarin digitalisieren das Dokument. 

(1) Herausgeber oder Herausgeberin beginnen mit der Rekonstruktion 
des ‚wahren‘ Textes. 

(1) Forscher oder Forscherin interpretieren zunächst das unbearbeitete 
Dokument. 

(1) Leser oder Leserin erfreuen sich an der Ästhetik des Gesehenen. 


Zumindest für bekennende Prä-Poststrukturalisten, wie den Verfasser, ist 
die Freude am nicht verstandenen Dokument gegenüber der Erleuchtung 
durch eine wohl erwogene historische Analyse geringer zu werten. Dem 
steht aber gegenüber, dass nach diesem Modell alle am Prozess Beteiligten 
sofort profitieren — nicht erst nachdem das Dokument, gefiltert durch das 
Lebenswerk eines Herausgebers und das weitere Lebenswerk eines inter- 
pretierenden Historikers, seinen Weg zum interessierten Leser gefunden 


% Ein frühes Konzept für eine rechnergestützte Arbeitsumgebung, die eine derartige Vorgehens- 
weise unterstützt: Better Access to Manuscripts and Browsing of Images. Aims and Results of an 
European Research Project in the Field of Digital Libraries: BAMBI Lib-3114. Hg. von Andrea 
Bozzi. Bologna 1997. 
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hat. Und diese Dynamik ist allen dabei das ursprüngliche Dokument mit 
interpretierendem Wissen anreichernden Tätigkeiten zu eigen. Editorische 
Arbeit schlägt sich in unserem Diagramm durch die durch (2) gekennzeich- 
nete ‚Phase‘ in der Bearbeitung. 


(2) Archivar oder Bibliothekarin digitalisierten das Dokument. 

(2) Herausgeber oder Herausgeberin bieten erste, vorläufige Kommentare. 

(2) Forscher oder Forscherin sind in der Lage, auf Grund der editorischen 
Vorarbeiten die erste Interpretation zu verbessern. 

(1) Leser oder Leserin erhalten erste Hilfen zum Verständnis des rätselhaf 
ten Schönen. 


Natürlich setzt sich diese ‚unmittelbare‘ Wirkung des intellektuellen Bemü- 
hens auf einer Ebene für die Voraussetzungen der Arbeit auf der nächsten 
weiter. So kann zwar die folgende unglückliche Situation entstehen: 


(3 
(3 
(3 
(83 


Archivar oder Bibliothekarin digitalisierten das Dokument. 
Herausgeber oder Herausgeberin boten erste, vorläufige Kommentare. 
Forscher oder Forscherin bieten eine Darstellung für die Laien. 

Leser oder Leserin verstehen sie nicht. 


DE DE Ze 


Der Vorteil eines dynamischen Konzepts auf der Basis elektronischer und 
jederzeit modifizierbarer Darstellungen beruhender Bereitstellung von In- 
terpretation erlaubt es den interpretierenden Forschern jedoch, nicht nur 
brieflich auf die Verwirrung ihrer Leser und Leserinnen einzugehen, son- 
dern die elektronisch publizierte Darstellung selbst zu ändern. Was das fol- 
gende Bild ergibt: 


(4 
(4 
(4 
(4 


Archivar oder Bibliothekarin digitalisierten das Dokument. 
Herausgeber oder Herausgeberin boten erste, vorläufige Kommentare. 
Forscher oder Forscherin verbessern die Darstellung für die Laien. 
Leser oder Leserin werden erleuchtet. 


xx 


4. Ein ernst gemeinter Hinweis 


Ich sagte einleitend, es schiene mir unter anderem deshalb sinnvoll, Ranke 
an den Beginn einer Darstellung dieser Art zu setzen, weil seine nur schein- 
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bar bescheidene Aussage aus einer Phase der Entwicklung der historischen 
Wissenschaften stamme, in der die historischen Fächer im Bewusstsein ih- 
rer unbestrittenen Bedeutung ruhten. Dass es eine Phase gab, in der dies 
der Fall war, scheint mir angesichts des defensiven, ja manchmal geradezu 
wehleidigen Selbstbildes, das die historischen Disziplinen in heutigen for- 
schungspolitischen Debatten geben, erinnerungsbedürftig. 

Für die Gründe dieses Rückganges der Wertschätzung der Disziplinen 
gibt es viele Gründe; und nicht alle davon sind negativ, wenn wir beden- 
ken, wie viel Prestige der Historiker aus seiner Rolle als Quasipriester einer 
pseudoreligiösen Verehrung für die eigene nationale Vergangenheit bezog 
(auch dann, wenn er selbst dieser nationalen Vergangenheit wesentlich ra- 
tionaler gegenüberstand). 

Doch einer der Gründe für die Wertschätzung der historischen Diszipli- 
nen lag in der Vergangenheit sicher darin, dass sie als die Schule für die 
kompetente Interpretation schwieriger Dokumente galten. 

Die historischen Disziplinen werden mit den Möglichkeiten der Bereit- 
stellung digitaler Informationen konfrontiert. Einer Fülle an widersprüchli- 
chen, ungenauen, unübersichtlichen und lückenhaften Informationen, wie 
sie das heutige Internet prägen und wie sie die aus den penibel strukturier- 
ten, sauberen, widerspruchsfreien und vollständigen Informationswelten 
der Naturwissenschaften stammende Informatik oft eher ratlos lässt. 

Es wäre schön, wenn die historischen Fächer, die ja seit langem Spezia- 
listen für das Ungenaue, Unübersichtliche, Lückenhafte und Widersprüch- 
liche sind, diese Fülle neuer Informationsmedien als Herausforderung be- 
greifen, die energisch anzunehmen ihnen durchaus eine wichtige Rolle bei 
der Lösung der derzeitigen Probleme im Umgang mit den neuen Informa- 
tionswelten zuweisen könnte. Denn: Wenn wir oben beschrieben haben, 
dass klassische Rollen in der neuen Situation überdacht werden müssen, so 
sind die historischen Disziplinen mit dieser Notwendigkeit keineswegs al- 
lein. Die Herausforderung zu übersehen, käme dagegen einem weiteren 
Rückzug in die Nische gleich. 


5. Ein nicht ganz so ernst gemeinter Hinweis 


Abschließend sei ein Hinweis darauf gestattet, dass die systematische Be- 
reitstellung von Quellen aus Archiven und Bibliotheken einen willkomme- 
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nen Nebeneffekt haben könnte, nämlich die starke Vermehrung des Interes- 
ses an den Inhalten der bewahrenden Einrichtungen. Es ist unbestritten, 
dass es eine der ersten und vornehmsten Aufgaben des Archivars und Bi- 
bliothekars ist, das ihm Übergebene zu schützen. Vielleicht ist die dadurch 
bedingte geringe Zugänglichkeit der Inhalte von Archiven und Bibliothe- 
ken aber zu einem nicht geringen Teil mitverantwortlich daran, dass ihr 
Prestige in den letzten Jahren sank. 

Als Beleg dafür, dass es ein erhebliches öffentliches Interesse auch an 
Dokumenten gibt, die der herrschenden Meinung nach nur dem Wohlge- 
bildeten unmittelbar zugänglich und dem großen Rest der Bevölkerung 
nur durch ausgefeilte didaktische Präsentationen vermittelbar sind, lassen 
Sie mich einige Zitate aus einer Diskussion im Internet anführen, auf die 
ich stieß, als ich im Rahmen des oben zitierten Projektes zur Evaluierung 
der Retrodigitalisierungsaktivitäten abzuschätzen versuchte, wer eigentlich 
die Manuskripte, die unter <http://www.ceec.uni-koeln.de> zugänglich 
sind, in so erstaunlich großer Zahl betrachtete. 

Festhalten möchte ich, dass die im Folgenden erscheinende Gruppe von 
Interessenten und Interessentinnen keinen plausiblen Grund für die digitale 
Bereitstellung von archivischer- und bibliothekarischer Überlieferung bil- 
det. Wenn deren Interessen aber mit abgedeckt werden, so dienen wir mit 
dieser digitalen Bereitstellung vielleicht einer viel weiteren Öffentlichkeit, 
als wir selbst annahmen. 

Somit zum leicht augenzwinkernden Ausklang, als Zitate, die für sich 
selbst sprechen sollen: 


Mailing 1: 15.06.2001, 12:09 


„Guten Tag! 
Unziale? Karolingische Minuskel? Textura? Initiale? Iluminationen? 


Wer schon immer mal mittelalterliche Handschriften aus der Nähe 
betrachten wollte, wird sich über die CODICES ELECTRONICI 
ECCLESIAE COLONIENSIS freuen: Die Universität Köln hat damit 
begonnen, die Dom- und Dioezesanbibliothek zu digitalisieren. 
Neben allen für die verschiedenen Fachdisziplinen notwendigen 
Informationen können die kompletten Handschriften in vier Aufloe- 
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sungsstufen betrachtet werden. Wer's lesen will: Lateinkenntnisse 
sind nicht hinderlich. 

<www.ceec.uni-koeln.de> 

Es gruesst 

Manfred” 


Mailing 2: 19.06.2001, 08:43 


„Hallo Manfred! 


Auch wenn ich kein Latain (sic!) kann, die Seiten haben mich sehr 
beeindruckt. Facsimilie und Nachdrucke gibt es bei uns in Karlsruhe 
nämlich immer nur im Präsenzbestand, und hier kann man sich die 
Anregungen direkt auf den PC laden. 


Wirklich toll. Dankeschön! 
Es grüßt ganz herzlich 
Ulrike” 


Mailing 3: 19.06.2001 , 12:00 


„Hallo Ulrike! 
Und die haben quasi eben erst angefangen. 


Ich ärgere mich manchmal sanft, daß ich Latein-Unterricht und 
Germanistik-Studium links liegen ließ, um als dummer Motorrad- 
Proll in den Tag hinein zu leben. Jetzt erfasse ich den Sinn der 
meisten Codices nur bruchstückhaft. 


Ich hab mal Druckvorlagenhersteller und damit auch Schriftsatz 
gelernt und freue mich immer, wenn ich Beispiele aus der Schriftge- 
schichte finde. Das hier jedoch kommt derart geballt, daß ich schon 
eine Nacht damit verbracht habe, Alphabete der verschiedenen 
Autoren zusammenzustellen. 


Es ist schon ein Unterschied, von Alkuin in der Übersetzung zu lesen 
oder direkt zu sehen, daß er sich nicht so wahnsinnig für Karls des 
Großen von oben verordnete Schreibreform interessierte. Da sehe ich 
Parallelen zu heute. 
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Manfred Thaller 


Im Herbst will ich damit beginnen, pseudoreligioese Schriften aus 
Clanthon im Codex-Stil festzuhalten (quasi ein Fanzine in Auflage 1). 
Tinten und Kiele habe ich schon, am Beschreibstoff mangelt's noch ... 


Es gruesst 
Manfred“ 


Datenstandards in der Erschließung historischer 
Dokumente 


Patrick Sahle 


1. Vorbemerkung 


Der diesem Text zugrunde liegende mündlich-visuelle Tagungsvortrag hat- 
te vor allem einführenden, orientierenden, fast schon Workshop-Charakter. 
Im Wechsel der situativen, kommunikativen und medialen Umstände wird 
er hier auf die wesentlichen theoretischen Grundlinien reduziert. Die ein- 
zelnen Standards werden nicht eingehend besprochen und auch das ab- 
schließende Praxisbeispiel wird nicht wiedergegeben: Anhand des Projek- 
tes Zentrales Verzeichnis Digitalisierter Drucke (zvdd) waren im mündlichen 
Vortrag die Auswahl von Standards, ihre Lokalisierung im vorgestellten 
allgemeineren Modell und die praktischen Schwierigkeiten ihrer Anwen- 
dung besprochen worden. Bei dem hier vorliegenden Text handelt es sich 
inhaltlich eher um ein Abstract, umfänglich um ein ausformuliertes, erwei- 
tertes Abstract. 


2. Zur Bedeutung von Standards 


Jeder Fall ist ein Sonderfall. Alle Gegenstände der historischen Überliefe- 
rung erfordern ihre je eigenen Weisen der Beschreibung und Erschließung. 
Jede Materialgattung, jede Überlieferungssituation und alle jeweils zu er- 
wartenden Auswertungsinteressen könnten die anzuwendenden techni- 
schen Standards in einer Weise bestimmen, die für jedes Projekt zu einer 
individuellen Lösung führen müsste. Dieser strikt material- und situations- 
orientierte Ansatz muss aber derzeit aus einer ganzen Reihe von Gründen 
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immer mehr relativiert werden. Mindestens drei Prinzipien des gegenwär- 
tigen Medienwandels haben als allgemeine Paradigmen weit reichende 
Auswirkungen auf alle Teilbereiche der konzeptionellen und praktischen 
Konfiguration der Erschließung. Die Rede ist hier 


- vom inkrementellen Prinzip, 
- vom Prinzip der Vernetzung und 
- vom Prinzip der Transmedialisierung. 


Was bedeuten diese Prinzipien für die ‚Erschließung‘, unter der in einem 
weiten Begriffsverständnis alle Arbeiten zusammengefasst werden können, 
die historisch überlieferte Materialien durch Wiedergabe, kritische Be- 
schreibung und Informationsanreicherung für die weitere wissenschaftli- 
che Verwendung vor- und aufbereiten? 

Früher war ein Faksimile ein Faksimile, ein Katalog ein Katalog, ein Re- 
gestenband ein Regestenband, eine Edition eine Edition und eine wissen- 
schaftliche Monographie eine wissenschaftliche Monographie. Abgeschlos- 
sene und für sich stehende Informationseinheiten. Abgeschlossene Publika- 
tionsformen, die zwar immer auch aufeinander verwiesen, sonst aber in 
keinem weiteren direkten Verhältnis zueinander standen. Heute — realis- 
tisch betrachtet aber in der allgemeinen Praxis wohl erst morgen - ist alles 
potentiell vernetzt. Das, was uns früher als expliziter Verweis erschien, 
wenn zum Beispiel eine Edition sich auf die in den Quellenstudien, Katalo- 
gen und Findbüchern nachgewiesenen Materialien bezog, hat heute den 
Status nur eines impliziten Verweises. Schließlich ist mit der realen Verlin- 
kung zwischen digitalen Ressourcen bzw. mit der Einbindung von digita- 
len Datenfragmenten eine neue Form der expliziten Verweisung und 
Bezugnahme zur leitenden Form des Möglichen geworden. 

Die einzelnen Formen der Erschließung bauen in einer veränderten Wei- 
se explizit aufeinander auf. Dies lässt die Grenzen zwischen den Publika- 
tionseinheiten, die medial bedingt waren aber konzeptionell gefasst wur- 
den, verschwimmen. Die traditionellen Formen greifen über sich hinaus: 
Der elektronische Katalog schließt auf der einen Seite digitale Faksimiles 
ein und bildet auf der anderen Seite potentiell auch eine Plattform für die 
Forschungsinstrumente zur Tiefenerschließung der Überlieferung. Die wis- 
senschaftliche Auswertung, die geschriebene Geschichte, inkludiert ihre 
Grundlagen und macht sich so potentiell in einer neuen Weise transparent. 
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Auf der einen Seite verschwimmen die Grenzen. Auf der anderen Seite 
müssen die einzelnen Arbeiten an der Überlieferung und die dabei entste- 
henden Informationen doch wieder konzeptionell getrennt werden. Sie 
müssen in einer neuen Weise ‚modularisiert‘ werden. Sie müssen als Bau- 
steine in einem umfassenden Informationsraum gedacht werden, der jetzt 
als in sich geschlossener und zusammenhängender Informationsraum eben 
dadurch besser sichtbar wird, dass er nicht mehr fragmentiert, sondern po- 
tentiell hoch integriert ist. 

Die ‚Trennungen‘ in der digitalen Erschließung sind teilweise andere 
Trennungen als in der traditionellen Erschließung. Zunächst ist für die di- 
gitalen Daten oft die Rede von der Trennung von Inhalt und Form. Dabei 
handelt es sich um ein weit verbreitetes Grundkonzept der gegenwärtigen 
technischen Lösungsansätze. Gemeint ist, dass Informationen auf einer 
Ebene abstrakter Datenmodelle und Daten gespeichert werden sollen. Da- 
bei sollen aber die Inhalte von Informationen gespeichert und verwaltet 
werden und nicht ihre äußere Erscheinungsform in jenen Präsentationsme- 
dien, mit denen der menschliche Benutzer schließlich in Kontakt kommt. 
Durch die Speicherung verallgemeinerter, codierter Informationen wird es 
außerdem möglich, dass gleiche Daten in verschiedenen medialen Konfigu- 
rationen mit unterschiedlichen Ergebnissen algorithmisch ausgegeben wer- 
den. Das Konzept beinhaltet so die Trennung von transmedialen Daten und 
(beliebigen) medialen Ausgabeformen. Da die medialen Ausgabeformen 
erstens algorithmisch erzeugt werden und zweitens höchst variabel sind, 
geht es vordringlich nur um die Daten, die ‚Inhalte‘ selbst. Dies ist die oben 
angesprochene ‚Transmedialisierung‘. 

Die transmedialisierten Inhalte können leichter explizit aufeinander auf- 
bauen - sie können sich gegenseitig übernehmen und integrieren. Alle Ar- 
beiten an der Überlieferung erscheinen heute als Bausteine einer Verarbei- 
tungskette, die bei der unmittelbaren materiellen Überlieferung ansetzt 
und diese immer tiefer erschließt, kritisch sichtend, kontextualisierend, 
transkribierend, deutend, analysierend immer weiter verarbeitet. Damit 
führen aber auch alle Arbeiten zu Bausteinen der Erschließung - zu Bau- 
steinen, deren Wert darin liegt, dass sie möglichst einfach in anderen Zu- 
sammenhängen benutzbar sein sollten. 

Wenn man nun betrachtet, wie die einzelnen Bereiche der Erschließung 
differenziert werden können, dann sehen wir, dass zunächst durchaus von 
den traditionellen Konzepten ausgegangen werden kann, um zu einer neu- 
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en Modularisierung zu kommen. Offensichtlich gibt es verschiedene For- 
men der Grunderschließung, die von der Objektbeschreibung über die Ka- 
talogisierung bis zur Regestierung (gewissermaßen einer ersten inhaltli- 
chen Durchdringung) reichen kann. Neu ist hier, dass noch ganz am An- 
fang die digitale Faksimilierung durch die Umkehrung der traditionellen 
Kostenrelationen' zu einer Selbstverständlichkeit wird, die zu einer ande- 
ren Transparenz der weiteren Erschließungsschritte führt und die relativen 
Positionen der einzelnen Module neu bestimmt.? 

Auf die Grunderschließung setzt die Textgewinnung auf. Hier wird der 
Text zunehmend als Skala verschiedenster, im Idealfall algorithmisch und 
dynamisch zu generierender Textformen erkennbar, die zwischen den Po- 
len quellennaher (benutzerferner) und quellenferner (benutzernaher) Dar- 
stellungsweisen eine Vielzahl von Positionen einnehmen können. Auswer- 
tende Formen der Arbeit mit der Überlieferung können in gleicher Weise 
auf einer Skala fortschreitender Verarbeitung und zunehmender Distanz zu 
den Quellen verortet werden. Auf dieser Verarbeitungskette können wir 
durchaus den gleichen Akteuren einen Platz zuweisen, die wir auch in der 
traditionellen Form spezielle Arbeiten durchführen gesehen haben: Archi- 
vare und Bibliothekare kümmern sich vor allem um Grunderschließungs- 
leistungen. Wissenschaftliche Editoren erstellen verschiedene Formen von 
Textrepräsentationen. Und Fachwissenschaftler der unterschiedlichsten 
Richtungen werten das überlieferte Material schließlich für spezielle Frage- 
stellungen aus. Allein die Übergänge werden jetzt vielleicht noch fließen- 
der als sie es bislang schon waren, da die integrative Kraft der transmedia- 
len Daten die Grenzen zwischen den Publikationsformen dieser Arbeits- 
schritte verwischen. 

Die Modularisierung der Arbeitsschritte geschieht auf der Achse der zu- 
nehmenden Verarbeitung der Überlieferung. Sie bezieht sich auch auf die 
Rolle der verschiedenen Akteure im Prozess der umfassenden Erschlie- 
fung. Sie ergibt sich aber auch aus einem anderen Aspekt der gegenwärti- 
gen Informationstechnologien: Vernetzung, Integration und Transmediali- 


! Darauf war bereits Manfred Thaller in seinem Eröffnungsreferat eingegangen. 


? In dem Moment, in dem das digitale Faksimile selbstverständlich als erstes verfügbar gemacht 
wird, verändert sich der ursprüngliche ‚Stellvertretercharakter’ von Katalogisaten, Quellenbe- 
schreibungen, Regesten und Textausgaben. Sie werden nun stärker als Informationsdestillate, als 
Hilfsmittel zum Auffinden von Quellen und als vorverarbeitende Formen für spezielle Auswer- 
tungsstrategien erkennbar. 
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sierung können nur dann funktionieren, wenn klar ist, welches die Objekte 
sind, die wir inhaltlich repräsentieren wollen. Die gegenwärtigen Informa- 
tionstechnologien sind darauf angewiesen, mit klar definierten Informa- 
tionseinheiten zu operieren. Auf unterschiedlich granularen Ebenen muss 
klar sein, wovon jeweils die Rede ist, was eigentlich der — zunächst konkre- 
te, dann aber auch fortschreitend abstrakt gefasste — Gegenstand ist, von 
dem die Daten handeln. Auch deshalb ist eine klare Modularisierung unse- 
res Informationsraumes unerlässlich. Wir müssen absehen können, über 
welche Objekte Informationen zu erwarten sind, wie wir diese (repräsen- 
tierten) Objekte ansprechen können und wie wir Informationen zu ihnen 
verstehen und verarbeiten können. Die Form definierter Objekte und der 
Zuschnitt der Informationen zu ihnen müssen berechenbar sein, um in an- 
deren Kontexten benutzt werden zu können. Und sie müssen bekannt sein, 
damit Schnittstellen zwischen technischen Systemen funktionieren können, 
über die Daten weitergegeben werden können. 

Die Definition von Objekten, Teilbereichen der Verarbeitung, Festlegung 
von Sichten auf Objekte und Schnittstellen ist auch deshalb so wichtig, weil 
die Organisation des Informationsraumes tatsächlich noch ein wenig kom- 
plexer ist, als dies bislang angedeutet worden ist. Es muss nämlich weiter- 
hin unterschieden werden zwischen der Eingabeform von Informationen, 
der Form der Datenhaltung und der Ausgabeform. Erschließungsinforma- 
tionen können auf verschiedenen Wegen gewonnen werden. Durch die 
Konversion bereits vorhandener Ressourcen ebenso wie über die Eingabe 
neuer Informationen. Die Schicht der Datenhaltung ist davon weitestge- 
hend unabhängig. Zwischen beiden besteht ein Verhältnis der Übersetzung 
und Abstraktion. Auf der anderen Seite besteht ein Verhältnis der Überset- 
zung und medialen Konkretisation zwischen der Verwaltung allgemeiner 
Daten und ihren Darstellungsweisen in den verschiedenen medialen Konfi- 
gurationen. Erschließungsdaten können hier ebenso zu einem gedruckten 
Werk ausformatiert werden, wie mit ihnen unter Umständen eine interakti- 
ve Netzpublikation angetrieben werden kann. Was die Modularisierung 
des Informationsraumes betrifft, so können auf der Seite der Publikation 
verschiedene inhaltliche Module wieder zusammenfließen. 

Eine weitere Differenzierung der Teilbereiche kann noch im Bereich der 
Datenhaltung vorgenommen werden. Hier ist — für manche technische An- 
sätze - noch zwischen Grunddaten, Strukturinformationen und Metadaten 
zu unterscheiden. 
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Der Informationsraum der Erschließung historischer Dokumente lässt 
sich insgesamt wie folgt skizzieren: 


Überlieferung 


| 


= Abbildung > 


| 


> Noruntrentenung | — 


| 


E 
- _ 


-| Textgewinnung |- 


| 


Auswertung |- 


Input Datenhaltung Output 


Grunddaten Metadaten 
Struktur 


Abbildung: Erschließung der Überlieferung als Informationsraum. 


Das Modell des Informationsraumes soll dabei helfen, die Bedeutung von 
konzeptioneller Modularisierung, klarer Objektdefinitionen, von Standards 
und von Schnittstellen in der Erschließung der historischen Überlieferung 
einsichtig zu machen. Es dient aber auch als Folie, um Standards zu lokali- 
sieren bzw. allgemeiner, um einzelne Erschließungsprojekte und deren Ver- 
wendung von Standards zu beschreiben. 
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Die Bedeutung technischer Standards liegt in der Ermöglichung eines 
modularen Erschließungskonzeptes. Die Grundfunktion von Standards ist 
es, Informationen durch Gleichmäßigkeit der Beschreibung auch nach au- 
ßen besser verstehbar und berechenbar zu machen. Diese Berechenbarkeit 
ist die Grundlage für die Erfüllung weiterer Anforderungen an digitale Er- 
schließungsinformationen: für die Nachhaltigkeit und langfristige Nutzbar- 
keit der gewonnenen Daten, für die algorithmische weitere Verarbeitung in 
anderen Nutzungssituationen und für die Anschlussfähigkeit und Integra- 
tionsfähigkeit in weitere Kontexte. Denn die einzelnen ‚Bausteine‘ der Er- 
schließung werden dadurch über ihre unmittelbare Erstellungssituation 
hinaus wertvoll, dass sie auch später noch in anderen Zusammenhängen 
nachgenutzt, weiter verarbeitet oder in andere Systeme integriert werden 
können. Dazu gehören dann zum Beispiel vertiefende Erschließungsarbei- 
ten. Dazu gehören unter Umständen aber auch Suchverbünde oder Portale, 
die Teilinformationen herausziehen, um die erschlossenen Objekte von ei- 
ner übergeordneten Warte aus nachzuweisen, besser auffindbar und besser 
nutzbar zu machen. 


3. Standards im Informationsraum 


Im Bereich der Standards begegnen einige scheinbare Paradoxien. So gibt 
es zwar einerseits bereits eine große Fülle von Standards, andererseits aber 
passt selten ein Standard ganz genau auf die konkret vorliegenden Proble- 
me. Man soll die vorhandenen Standards benutzen und nicht immer wie- 
der neue Standards erfinden, muss dann aber immer einen Mittelweg fin- 
den zwischen der glatten Anwendung bestehender Standards und den ei- 
genen Bedürfnissen. Diese führen in der Regel zu Anpassungen, die zwar 
in so genannten ‚Anwendungsprofilen‘ dokumentiert werden können, 
letztlich aber den Status der verwendeten Datenbeschreibung ‚als Stan- 
dard‘ gefährden. Dieses Problem resultiert daraus, dass Standards und die 
Situationen, in denen sie verwendet werden, durch eine ganze Reihe von 
Aspekten bestimmt werden, die noch über die Modularität des erschlie- 
ßenden Informationsraumes hinaus das Feld der Datenbeschreibungen 
ausdifferenzieren. 
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Für die Lokalisierung und Beschreibung von Standards, aber auch für 
die Auswahl zur Verwendung in bestimmten Projektkontexten, werden ei- 
ne Zahl von Parametern genutzt, die im Folgenden aufgelistet werden. 


3.1 Grad der Allgemeinheit 


Standards können sich auf unterschiedlichen Abstraktionsebenen befinden. 
Das ‚relationale Datenmodell‘ oder das ‚hierarchische Datenmodell‘ sind 
allgemeine Weisen der strukturierten Abbildung von Informationen. Diese 
können sich in konkreteren Standards niederschlagen: SQL (Standard Que- 
ry Language) ist ein Abfragestandard für Daten, die dem relationalen Mo- 
dell folgen. XML (eXtensible Markup Language) ist eine Realisation des all- 
gemeinen Modells ‚Textauszeichnung‘. Dieses ist selbst sowohl an sequen- 
tiellen wie auch hierarchischen Grundstrukturen orientiert. XML ist ein 
Beispiel für einen Meta-Standard, der aus einer allgemeinen Warte zwar 
konkret ist (indem er ein bestimmtes Datenmodell realisiert und genaue 
Struktur- und Syntaxvorgaben macht), aus einer speziellen Warte aber all- 
gemein. Für die konkrete Anwendung muss auf der Grundlage des Meta- 
Standards erst eine Anwendungssprache formuliert werden. 


3.2 Determinismus 


Standards sind wie Sprachen. Ihr Funktionieren liegt weniger in einer ab- 
strakten Vorgabe, wie etwas gemeint ist, als vielmehr im gemeinsamen Ge- 
brauch der Sprecher. In der Regel sind Standards nicht selbsterklärend, 
sondern müssen dokumentiert werden, um ihren Sinn zu klären. Weil diese 
Dokumentation aber natürlichsprachlich erfolgt, bleibt notwendigerweise 
immer Raum für abweichende Interpretationen bei den Benutzern. Dieser 
Raum kann unterschiedlich groß sein. Ein Standard kann zu sehr gleichmä- 
figen Anwendungen führen wie auch zu sehr ungleichmäßigen. Dies hängt 
nicht unbedingt von der Präzision und Vollständigkeit der Dokumentation 
ab, sondern auch von den anderen hier beschriebenen Parametern. 


3.3 Beschreibung oder Austausch 


Standards können die Beschreibung von Informationen festlegen oder 
einen technischen Rahmen für den Austausch von Daten bilden. Solche 
Schnittstellen-Standards können wiederum unterschiedlich allgemein sein. 
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Allgemeine Übertragungsprotokolle wie HTTP (Hypertext Transfer Proto- 
col) oder Schnittstellen wie CGI (Common Gateway Interface) bilden nur 
einen allgemeinen Rahmen für die Kommunikation der Daten, ohne etwas 
über die Inhalte auszusagen. Speziellere Schnittstellen-Protokolle wie 
Z39.50 bzw. ZING (Z39.50 International Next Generation) oder OAI-PMH 
(Open Archives Initiative, Protocol for Metadata Harvesting) betreffen da- 
gegen bestimmte Datenbereiche, hier zum Beispiel die Metadatenschicht. 


3.4 Materialgattung 


Offensichtlich brauchen verschiedene Materialien ihre eigenen Standards 
zur Beschreibung. Die TEI-Guidelines (Text Encoding Initiative) betreffen 
Volltexte, der MASTER-Standard die Codierung von Handschriftenkatalo- 
gen (Manuscript Access through Standards for Electronic Records).” EAD 
(Encoded Archival Description) bezieht sich auf Findmittel in Archiven. 
SVG (Scalable Vector Graphics) dient der Wiedergabe von ‚Bildern‘ (Skiz- 
zen, Diagramme), die sich über Vektoren beschreiben lassen. 


3.5 Verarbeitungsgrad 


In meinem Modell des Informationsraumes spielte die fortschreitende Ver- 
arbeitung eine entscheidende Rolle. Manche Standards betreffen eher 
Grunddaten, manche spätere Verarbeitungsstufen. MASTER ist ein Stan- 
dard für die Katalogisierung von Text-Objekten, TEI ein Standard für die 
Wiedergabe der Texte in den Objekten. 


3.6 Input - Datenhaltung - Output 


Manche Standards überspannen den Dreischritt Eingabe — Verwaltung - 
Ausgabe. Oft ist aber die Verwendung unterschiedlicher Lösungen sinn- 
voll. Dabei besteht für die Verwendung von allgemeinen Standards auf der 
Ebene des Inputs noch die geringste Notwendigkeit: hier können durchaus 
lokale technische Lösungen verwendet werden, weil der Austausch und die 
weitere Verwendung der gewonnenen Daten ja erst auf der Ebene der Da- 
tenhaltung ansetzt. Allein in sehr hoch modularisierten Projekten mit zum 
Beispiel weit verteilter Datenerfassung ist die Verwendung von Standards 


° MASTER ist allerdings in der letzten Fassung der TEI-Guidelines (P5) aufgegangen. 
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bereits bei der Dateneingabe wichtig. Ein Standard für die Erfassung von 
Daten ist XForms (XML-Formulare). Die meisten Standards betreffen die 
Ebene der Datenhaltung, da es hier um eine möglichst sachadäquate, diffe- 
renzierte Beschreibung und Verwaltung von Informationen geht. Datenhal- 
tungs-Standards sind oft zugleich noch relativ allgemein, so dass sie für 
eine unmittelbare Darstellung in Output-Formen gar nicht geeignet sind. 
Dies betrifft zum Beispiel XML im Allgemeinen oder konkrete XML-Aus- 
zeichnungssprachen wie die TEI. Auf der anderen Seite können solche all- 
gemeinen Daten dann algorithmisch in Ausgabeformate überführt werden, 
die so präzise sind, dass sie von verschiedenen Medien unmittelbar darge- 
stellt werden können. Hier wäre zum Beispiel auf TEX, PS (PostScript) oder 
PDF (Portable Document Format) zu verweisen, mit denen Druckmedien 
generiert werden können. Mit PDF, dann aber vor allem auch (X)HTML 
(Hypertext Markup Language), wären hier auch die wichtigsten Standards 
für den Output von Texten in digitalen Medien genannt. Ähnliche Unter- 
scheidungen wären parallel zum Beispiel für den Bereich der Bilddaten zu 
machen: Hier ist TIFF ein Eingabeformat, LZW-komprimiertes TIFF ein 
Speicherformat und JPEG, GIF oder PNG Ausgabeformate. 


3.7 Informationsdimensionen 


Grunddaten, Strukturdaten, Metadaten, Semantik. Standards können sich 
auf unterschiedliche Ebenen der digitalen Repräsentation, auf unterschied- 
liche Sichtweisen auf Objekte beziehen. ASCII (American Standard Code 
for Information Interchange) und UNICODE betreffen die Zeichencodie- 
rung von Textdaten, Auszeichnungssprachen wie die TEI regeln die Be- 
schreibung der Struktur von Volltexten. Die TEI umfasst dann aber auch 
schon den Bereich der Metadaten, der für andere Objekte von gesonderten 
Standards abgedeckt wird: Sollen zum Beispiel nur die Metadaten biblio- 
graphischer Einheiten erfasst werden, so stehen dafür bibliothekarische 
Formate wie MAB (Maschinelles Austauschformat für Bibliotheken) oder 
MARC (Machine Readable Catalogue) zur Verfügung. Ein wichtiger Stan- 
dard, der zwar für digitale Ressourcen im Allgemeinen ‚zuständig‘ ist, sich 
hier aber ebenfalls ausdrücklich auf die Metadatenschicht beschränkt, ist 
DC (Dublin Core). Metadaten- und Strukturdaten digitaler Objekte deckt 
METS (Metadata Encoding and Transmission Standard) ab, auf die Struk- 
turdaten gedruckter Daten beschränkt sich E-Bind (electronic Binding 
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DTD). Gerade in letzter Zeit hat sich jenseits der deskriptiven Metadaten 
noch eine Schicht der eher deutenden semantischen Daten etabliert. Auch 
bisher haben inhaltlich orientierte Beschreibungsstandards wie MIDAS 
(Marburger Informations-, Dokumentations- und Administrationssystem) 
für Objekte der Kunst oder ‚Iconclass’ für die Klassifikation von Bildinhal- 
ten im Grunde eine semantische Deutung ihrer Gegenstände vorgenom- 
men. Mit den Standards im Vor- und Umfeld des kommenden ‚Semantic 
Web‘ sind hier aber allgemeinere Formate entstanden, die semantische In- 
halte und Bezüge von digital beschriebenen Objekten verwaltbar machen. 
Zu nennen wären hier zum Beispiel RDF (Resource Description Frame- 
work), XTM (XML Topic Maps) oder OWL (Web Ontology Language). 


3.8 Konzeptionalisierung 


Selbst wenn für einen bestimmten Anwendungsfall alle bereits genannten 
Parameter klar sein sollten, so führt dies nicht dazu, dass am Ende ein Stan- 
dard als Mittel der Wahl zur Verfügung stehen würde. Oft würde man fest- 
stellen, dass für den speziellen Fall noch kein Standard entwickelt worden 
ist, so dass man auf eine Beschreibungsweise ausweichen müsste, die in 
dem einen oder anderen Parameter von den eigentlichen Anforderungen 
abweicht. Oft hat man aber auch die Auswahl zwischen mehreren Stan- 
dards. Diese unterscheiden sich dann zum Beispiel in der Art und Weise, 
wie sie die Beschreibung der Objekte konzeptionalisiert haben. Ein Beispiel 
hierfür wären MAB und MARC: Beide betreffen die Metadaten zu biblio- 
graphischen Einheiten. Sie beschreiben sie aber durchaus mit leicht unter- 
schiedlichen Konzepten. 


3.9 Technische Umsetzung 


Selbst wenn sonst alle anderen Parameter übereinstimmen sollten, so kann 
ein Unterschied zwischen verschiedenen Standards außerdem immer noch 
in der technischen Umsetzung auch gleicher Konzepte liegen. Dabei kön- 
nen die technischen Unterschiede Auswirkungen auf die Gewinnung, die 
Speicherung und Verwaltung, den Austausch und die Darstellung der In- 
formationen haben und dadurch Kriterien für die Benutzung eher des 
einen oder des anderen Formates liefern. Ein Beispiel aus diesem Bereich 
wären die Standards zur Codierung von Bildern nach dem Bildpunkte- 
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Prinzip (‚bitmaps’). JPEG (Joint Photographic Experts Group), PNG (Por- 
table Network Graphics), GIF (Graphics Interchange Format) oder TIFF 
(Tagged Image File Format) dienen alle der Codierung von Bildern nach 
dem gleichen Prinzip. Sie unterscheiden sich allein nach der Art der Daten- 
komprimierung, den Farbräumen und den Möglichkeiten zusätzlicher Do- 
kumentation der Bilder. Bereits dies können aber Aspekte sein, die im je- 
weiligen Anwendungsfall den Einsatz eines bestimmten Formats nahe le- 
gen. 


4. Probleme und Fehlerquellen bei der Verwendung von 
Standards 


Die Auswahl und Anwendung geeigneter Standards ist nicht trivial. Stan- 
dards können mehrere Felder abdecken, sich überschneiden, andere Stan- 
dards beinhalten oder die Verwendung ergänzender Standards nahe legen. 
Weiterhin ist zu überlegen, ob und wie weit Standards für die lokalen Er- 
fordernisse angepasst werden sollten. Bei der Auswahl und Anwendung 
von Standards treten oft ähnliche Probleme auf, werden häufig ähnliche 
Fehler gemacht. Auf einige sei hier abschließend hingewiesen. 


4.1 Falsches Datenmodell 


Zu den seltener werdenden Fehlern gehört, dass für Informationen, die 
nun einmal eine bestimmte Grundstruktur aufweisen, das falsche Grund- 
datenmodell gewählt wird. In der Vergangenheit ist es häufig vorgekom- 
men, dass zum Beispiel hierarchisch organisierte Dokumentinformationen 
oder Textdaten mit einem relationalen Modell abgebildet wurden. 


4.2 Nicht materialadäquater Standard 


Manchmal werden Standards für allgemeiner gehalten als sie es tatsächlich 
sind. TEI ist ein Standard, der vornehmlich aus literaturwissenschaftlicher 
und linguistischer Sicht heraus die Textgattungen dieser beiden Teilfächer 
beschreiben sollte. Wird TEI für andere Textgattungen (zum Beispiel Ur- 
kunden) und andere Analyseabsichten (zum Beispiel historische For- 
schung) eingesetzt, dann muss mit einer Schieflage bei der Anwendung ge- 
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rechnet werden. Ein Standard ist auch ein Wahrnehmungsfilter, mit dem 
die betrachteten Dinge in einem ganz bestimmten Licht erscheinen. 


4.3 Anpassung und Dokumentation 


Zuweilen muss beim Fehlen eines geeigneten spezialisierten Standards auf 
einen anderen Standard zurückgegriffen werden, der eigentlich nicht ganz 
genau passt. Erfolgt dann keine Anpassung an die speziellen Gegebenhei- 
ten oder aber keine Dokumentation der veränderten Benutzung, dann ge- 
rät die Hauptfunktion der Standards, nämlich berechenbare Beschreibun- 
gen zu erzeugen, in Gefahr. Man wird dann in der Weiterverwendung ent- 
weder Daten bekommen, die nicht der Sache entsprechen oder Daten, die 
zwar der Sache entsprechen, deren Funktionsweise aber nicht mehr dem 
Ausgangsstandard entspricht und deshalb nicht berechenbar ist. 


4.4 Vermischung von Datenhaltung und Output 


Einer der häufigsten Fehler, die auch heute noch immer wieder begegnen, 
ist die Verwendung von Output-Formaten für die Datenhaltung. Immer 
wieder gibt es Projekte, die allgemeine Daten nicht nur in PDF oder HTML 
darstellen, sondern diese Formate auch als zentrale Organisations- und Da- 
tenhaltungsstandards benutzen. Das ist dann legitim, wenn man entweder 
außer der unmittelbaren Publikation alle weiteren Verwendungsmöglich- 
keiten für die Daten von vornherein ausschließen kann oder wenn man der 
Auffassung ist, dass die zu erschließenden Objekte wirklich keine weiteren 
Informationen enthalten als jene, die sich auch mit den Publikationsforma- 
ten wiedergeben lassen. Wenn es zum Beispiel um Texte geht, dann ist ein 
Standard wie PDF als Datenhaltungsstandard nur unter der einschränken- 
den Prämisse vernünftig einsetzbar, dass man unter ‚Iext’ keine weiteren 
Informationen versteht als jene, die sich auf der typographischen Oberflä- 
che abbilden lassen. Zu bedenken ist aber auch, dass Standards für die 
Medialisierung oft recht stark an den gegenwärtigen Hard- und Software- 
umgebungen und an den gegenwärtigen Rezeptionsgewohnheiten orien- 
tiert sind. Dies steht tendenziell im Widerspruch zu einer langfristigen 
Nutzbarkeit, die auf möglichst allgemeinen Formen der Datencodierung 
und Datenstrukturierung beruhen sollte. 
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4.5 Mapping 


Ein letztes Problem betrifft die Verwendung von Inhalten aus verschiede- 
nen Standards. Daten müssen in der Regel gemappt werden, um sie in an- 
deren Kontexten weiter verwenden zu können. Dabei handelt es sich um 
einen ganz klassischen Übersetzungsprozess, mit den bekannten Proble- 
men der Übersetzung: Eine rein mechanische Übersetzung, die einfach von 
der Definition des jeweiligen Standards ausgeht, wird zwangsläufig Infor- 
mationsverluste und Fehlinterpretationen nach sich ziehen. Es ist oft un- 
umgänglich, die jeweiligen Daten und ihre Entstehungsbedingungen we- 
nigstens auf der Projektebene etwas genauer zu verstehen, um sie sinnvoll 
weiter benutzen zu können. Standards bieten hier die Grundlage, um Da- 
ten überhaupt effizient ‚mappen’ zu können. Sie bieten aber oft keine Ga- 
rantie für das Funktionieren einer unmittelbaren, unkontrollierten und un- 
differenzierten Verarbeitung 


5. Schluss 


Der vorliegende Beitrag hat versucht, das Feld der Verwendung von Stan- 
dards bei der Erschließung historischer Dokumente zu umreißen. In einem 
allgemeinen Modell der fortschreitenden Erschließung als einem umfas- 
senden Informationsraum können einzelne Module isoliert werden, denen 
verschiedene technische Standards entsprechen. Standards können aber 
auch unter weiteren Aspekten beschrieben und verortet werden. Diese kön- 
nen innerhalb konkreter Forschungsprojekte bei der Auswahl und Anwen- 
dung geeigneter Standards ebenso helfen wie bei der Suche nach mösgli- 
cherweise nicht optimalen Verwendungsweisen. 


Fachspezifische Indexierung von historischen 
Dokumenten | 


Quellen zwischen Zeichenketten und Information - Beispiel 
Urkunden 


Georg Vogeler 


1. Einleitung 


Die Geschichtswissenschaft digitalisiert sich: Es werden Portale aufgebaut, 
fachspezifische Metasuchen installiert, Onlinerezensionen und -publikatio- 
nen verbreiten sich und werden immer häufiger zitiert (wenn auch vorwie- 
gend innerhalb der ‚Gemeinde‘). Die ‚Cultural Heritage‘-Institutionen 
wagen sich immer weiter in die digitale Welt, an ihrer Spitze die Bibliothe- 
ken, aber dicht gefolgt von Museen und Archiven. Es ist also an der Zeit, 
sich zu fragen, wie man die von diesen Institutionen bereitgestellten histo- 
rischen Informationen auch wiederfindet. 

Neben den allgemeinen Suchmaschinen wie Google, Yahoo oder Ask 
gibt es zu diesem Zweck auch fachspezifische Portale und Suchmaschinen. 
Chronicon ist ein solches Angebot, das die Bayerische Staatsbibliothek auf- 
gebaut hat.' Es vermittelt den Zugang zu 32 bibliographischen Onlinehilfs- 
mitteln, die mit einer einzigen Suchabfrage gemeinsam abgefragt werden 
können. Auch das Berliner Portal Clio Online bietet eine solche Metasuche 
an: Hier gibt es neben der Suche in 28 bibliographischen Datenbanken auch 
ein Metaportal zur Quellenrecherche.” Wenn man sich die dahinter stehen- 
den Datenbanken genauer ansieht, stellt man fest, dass es sich um genau 


1 Adresse: http://www.chronicon.de/ (letzte Einsichtnahme am 21.04.2006). 
? Adresse: http://www.clio-online.de/ (letzte Einsichtnahme am 21.04.2006). 
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drei handelt: das Archivportal des Landes Nordrhein-Westfalen,’ die VD17-- 
Datenbank der Herzog-August-Bibliothek in Wolfenbüttel‘ und die Nach- 
lassdatenbank des Bundesarchives. 

Ist es etwa so, dass die Grundlage historischer Arbeit, die Quellen, noch 
gar nicht online suchbar ist? Sicherlich sind im Netz noch nicht so viele 
Quellenbestände recherchierbar wie mit gedruckten Hilfsmitteln. Die 
Situation ist jedoch beileibe nicht schlecht. So haben andere Archivverwal- 
tungen auch ähnliche Angebote wie das Land Nordrhein-Westfalen einge- 
richtet: das Portal des Landesarchivs Baden-Württemberg,° das Hessische 
Archiv-Dokumentations- und -Informationsystem HADIS oder Ariadne, 
das Archive Information and Administration Network der Archive in Mecklen- 
burg-Vorpommern.’ In diesen Portalen kann man sich einerseits zu den ein- 
zelnen Archiven durchklicken, man kann aber auch in allen Bestandüber- 
sichten und Findbüchern, die schon digital vorliegen, suchen - ohne erst 
das einzelne Archiv anzusteuern. Wir haben es also je mit einer Art ‚Quel- 
lensuchmaschine‘ zu tun. 

Neben den Archiven sind auch andere Quellencorpora online zu finden. 
Ich möchte hier keine umfangreiche Übersicht über solche Corpora und ih- 
re unterschiedlichen Präsentationsformen bieten, sondern kurz zwei Ange- 
bote nennen, die sich mittalterlichen Urkunden verschrieben und sie auf 
besondere Art und Weise durchsuchbar gemacht haben: Da sind die hessi- 
schen Landgrafen-Regesten online’ und der Codice diplomatico della Lombardia 
medievale.” Das Erstere fällt durch die Möglichkeit auf, in den Volltexten 
nach lemmatisierten Wörtern zu suchen, das heißt Varianten von Wörtern 
in Flexionsformen durch Angabe des Grundwortes, das Letztere durch eine 
umfangreiche Expertensuche, die einen tief in die sachlichen und sprachli- 
chen Strukturen des Textes hineinführt. 


3 Adresse: http://www.archive.nrw.de/ (letzte Einsichtnahme am 21.04.2006). 

* Adresse: http://www.vd17.de/ (letzte Einsichtnahme am 21.04.2006). 

5 Adresse: http://www.nachlassdatenbank.de/ (letzte Einsichtnahme am 21.04.2006). 

6 Adresse: http://www.landesarchiv-bw.de/ (letzte Einsichtnahme am 21.04.2006). 

7 Adresse: http://www.hadis.hessen.de/ (letzte Einsichtnahme am 8.04.2006). 

8 Adresse: http://ariadne.uni-greifswald.de/index.html (letzte Einsichtnahme am 21.04.2006). 


° Adresse: http://online-media.uni-marburg.de/ma_geschichte/lgr/ (letzte Einsichtnahme am 
18.04.2006). 


1 Adresse: http://cdim.unipv.it/ (letzte Einsichtnahme am 21.04.2006). 
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Ein Konzept für eine fachspezifische Suchmaschine, die dem Historiker 
dabei hilft, Quellen zu seinen Fragestellungen zu suchen, ja vielleicht sogar 
nicht nur Quellenreferenzen, sondern auch schon Quellenaussagen, muss 
sich mit den Fähigkeiten solcher Suchen vergleichen lassen. 

Worin liegt denn der Vorteil der beiden Suchen? Sie ermöglichen es dem 
Historiker, Informationen zu finden, ohne die genaue Zeichenrepräsenta- 
tion dieser Information zu kennen: Die Suche nach Kaufgeschäften in den 
hessischen Regesten kann mit einer Suchen nach „kaufen“ gestartet werden 
und muss sich nicht darum kümmern, ob das Phänomen „kaufen“ mit 
einem Partizip „gekauft“ oder in Flexionen wie „kauft“ ausgedrückt ist. 

Die online verfügbaren Editionen des Codice diplomatico della Lombardia 
medievale reichen bis zum Jahr 1150. Ein Historiker, der sich für Anwesen- 
heiten, Aktivitäten und Rezeption der Ottonen in Norditalien interessiert, 
kann sich zu einer Personensuche vorarbeiten. Dort kann er die 45 Einträge 
zu „Otto imperator“ ebenso aussuchen wie die 3 zu „Otto I., imperatore“, 
„Otto IL, imperatore“ und zu „Otto II., imperatore“. Eine Volltextsuche 
nach „Otto“ (676 Treffer) liefert gänzlich andere Ergebnisse: Ottonis (555 
Treffer) wird bei einer einfachen Stichwortsuche übergangen, bei einer 
rechtstrunkierten Suche dafür auch „Ottobelli” (38 Treffer) mit ausgewie- 
sen. Die ottonischen Kaiser sind also nur als Personen und nur schwierig 
als Teil des Volltextes identifizierbar.'" 

Die mittelalterlichen Urkunden werden auch weiterhin der Testfall sein, 
an dem die vorhandenen Suchmaschinentechnologien exemplifiziert wer- 
den. Wie weit die für dieses Material sinnvollen Techniken auch für andere 
Quellengattungen nützlich sind, ist weiteren Studien vorbehalten. 


2. Suchmaschinentechnologie 


Eine moderne Suchmaschine hat — sehr vergröbert - etwa folgenden Auf- 
bau: Ein Crawler durchsucht das Internet, das heißt er verfolgt alle auf 
Web seiten vorhandenen Links. Die dabei gefundenen Webseiten übergibt 
er an Software, die das Dokument in einzelne Wörter zerlegt und daraus 
einen Index aufbaut. Wenn der Index abgefragt wird, dann wird die gefun- 


1 Es sei noch darauf hingewiesen, dass auch die Personenindexeinträge voneinander abweichen: 
Otto imperator: 39, Otto imperator augustus: 2, Otto imperatore: 2, Otto, imperator: 2, Otto I, II, 
II, je ein Eintrag. 
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dene Menge an Treffern nach Relevanz geordnet. Die Techniken zum Su- 
chen der Dokumente, die Organisation eines schnellen Index und die Me- 
thoden zur Bewertung der Relevanz eines Dokumentes für die Suchanfrage 
sind die drei Bereiche, in denen Suchmaschinenhersteller ihre ganz spezifi- 
schen Kompetenzen und Geschäftsgeheimnisse haben. Eine fachspezifi- 
sche Suchmaschine muss sich eben den selben drei Bereichen widmen. 
Hier soll es nun vorrangig um den Index gehen, auch wenn einige Überle- 
gungen zur Bewertung mit einfließen. 

Aus technischer Sicht ist der Index die Form, wie die Daten so abgelegt 
werden, dass die Maschine schnell auf sie zugreifen kann. Die einschlägi- 
gen Stichwörter lauten ‚B-Baum‘, ‚Hash‘, ‚R-Baum’ usw. und meinen ver- 
schiedene Arten, die einzelnen Wörter so auf der Festplatte abzulegen, dass 
ein gegebenes Suchwort schnell mit ihnen verglichen werden kann. Die Zu- 
griffsgeschwindigkeit ist dabei die Kernfrage. Welcher Art die Daten sind, 
interessiert nicht, denn sie sind einfach ein beliebiger Code. Anders formu- 
liert: Die Techniker interessieren sich vorrangig dafür, wie der Computer 
schnell eine beliebige Zeichenkette in einer Liste findet. Ob diese Liste Per- 
sonennamen, Archivsignaturen, Berufscodes einer Volkszählung oder Ge- 
nomsequenzen enthält, interessiert nicht. 

Historiker haben da eine andere Perspektive. Sie denken an das Register 
im Buch, das ihnen hilft, eine bestimmte Stelle im Text zu finden, ein Kapi- 
tel, einen Abschnitt, der sich mit Friedrich II. beschäftigt oder die Urkun- 
den, die für den Deutschen Orden ausgestellt worden sind. Sie beginnen 
die Recherche in einem Quellencorpus im Register, wenn sie den Kontext 
des Wortes „gubernare“ ermitteln wollen oder wenn sie etwas über die 
Mühlen im 13. Jahrhundert erfahren möchten. 

Quellen sind damit für Historiker nicht nur reine Zeichenketten, son- 
dern Informationsträger. Sie brauchen Indices, die an diesen Informationen 
orientiert sind. Eine Volltextsuche ist dabei nur ein Hilfsmittel bei der Infor- 
mationsrecherche. Eine fachspezifische Suchmaschine muss also einen In- 
dex aufbauen, der möglichst informationsnah gestaltet ist. 

Dabei kann es nicht darum gehen, dass eine Heerschar an Wissenschaft- 
lern alle online verfügbaren Quellenbestände systematisch erschließt. Es 
muss im Gegenteil darum gehen, Quellenbestände, die ohne Erschließung 
ins Netz gestellt werden, mit Hilfe von kalkulierbaren Prozeduren automa- 
tisch aufzubereiten, so dass sie ihre individuellen Eigenheiten behalten 
können, im Index der Suchmaschine aber eine Repräsentanz finden, die 
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mehr über ihren Informationsgehalt verrät als nur eine Liste aller Zeichen- 
ketten, die zwischen Worttrennungselementen, das heißt Leerräumen, Satz- 
zeichen usw. stehen. 


3. Möglichkeiten zur graphischen und sprachlichen 
Abstraktion 


Eine erste Abstraktionsschicht zwischen Quellentext und Information stellt 
die Orthographie dar. Wo wir in den jüngsten Diskussionen um ‚alte‘, 
‚neue‘ und ‚reformierte‘ Rechtschreibung gelernt haben, dass es sogar in ei- 
ner orthographisch sehr regelbewussten Zeit Varianten gibt, die gleiche 
Wörter unterschiedlich graphisch repräsentieren, so sind an Quellen arbei- 
tende Historikerinnen und Historiker sich der um so größeren Vielfalt bis 
ins 17. Jahrhundert wohl bewusst. Ein erstes Ziel einer automatisierten 
Abstraktion von den Zeichenketten der digitalen Quellenrepräsentanz ist 
es also, möglichst viele dieser Varianzen auszuschalten bzw. zu tolerieren. 

Die Techniken dazu sind nichts Neues. Sie sind auch schon in komplexe 
fachspezifische Softwarelösungen eingeflossen.'” Sie seien hier aber erneut 
zusammengestellt und auf ihre Nutzbarkeit für eine fachspezifische Such- 
maschine geprüft. 

Eine grundlegende Technik, graphische oder sprachliche Varianzen in 
eine Suche einzufügen, sind die ‚regulären Ausdrücke‘. Diese in vielen 
Softwareumgebungen implementierten Mustervergleiche bieten eine Nota- 
tion an, eine Zeichenkette aus Alternativen bestehen zu lassen. Ein solcher 
Ausdruck „\<Ofdt][.]{0,1}0.*?\>“ sucht nach Wörtern, die mit einem „O“ 
anfangen, auf das ein „d“ oder ein „t“ folgt, dem noch maximal ein zweiter 
Buchstabe folgen kann, ein „o“ folgen muss, bevor das Wort beliebig enden 
kann. Damit lassen sich zum Beispiel Schreibungsvarianten des Namens 
„Otto“ abbilden: „Oto“, „Odo“, „Oddo“, „Oddonis“, „Othonem“ entspre- 
chen alle diesem Muster. 


1? Vgl. Manfred Thallers kleio (Adresse: http://www.hki.uni-koeln.de/kleio/, letzte Einsichtnahme 
am 20.04.2006) und darauf aufbauende Anwendungen. Einem dem hier vorgestellten Ansatz 
vergleichbar ist: Andrea Ernst-Gerlach und Norbert Fuhr: Generating Search Term Variants for 
Text Collections with Historic Spellings. In: 28th European Conference on Information Retrieval 
Research (ECIR 2006). Adresse: http://www.is.informatik.uni-duisburg.de/bib/pdf/ir/Ernst_ 
Fuhr:06.pdf (letzte Einsichtnahme am 21.04.2006), die jedoch nicht bei der Indexierung, sondern 
beim Ranking ansetzen. 
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Einem ähnlichen Prinzip folgen ‚Name Matching‘-Algorithmen, von 
denen es eine größere Menge gibt. Der bekannteste ist das schon 1918 ent- 
wickelte ‚Soundex‘-Verfahren, das den amerikanischen Einwanderungsbe- 
hören half, der Sprachen- und Namensvielfalt der europäischen Einwan- 
derer Herr zu werden. Der klassische Soundex-Algorithmus erhält den 
ersten Buchstaben eines Namens und fügt bis zu 3 Ziffern an, die für die 
Konsonanten des Namens stehen und sie in Gruppen ordnen. Aus „Otto- 
nem” wird dann „O355”; aus „Odo“ „0300“ und aus „Othonis“ „0352“. 
Das Verfahren ist relativ stark auf die englische Sprache ausgerichtet, wes- 
halb verschiedene Modifikationen vorgeschlagen worden sind." 

Es ist sichtbar, dass auch eine solche Umwandlung immer noch unge- 
naue Ergebnisse liefert. Ungenauigkeit ist in der Informatik auch aus der 
Arbeit mit automatischer Texterkennung bekannt: Leichte Abweichungen 
vom orthographisch eingeführten Zeichenbestand entstehen dabei leicht. 
Um auch in solchen ‚unsauberen‘ Texten suchen zu können, sind Algorith- 
men entwickelt worden, die sich dem Problem des ‚nearest neighbour 
widmen. Dabei spielt der Grad der Veränderung eine entscheidene Rolle: 
Am geläufigsten ist wohl die 1965 vorgestellte ‚Levenshtein-Distanz‘, die 
die Anzahl der mindestens notwendigen Operationen beziffert, die es 
braucht, um aus einer Zeichenkette eine zweite werden zu lassen. Damit 
kann ein Wert festgelegt werden, bis zu dem zwei Zeichenketten, die nur 
leicht voneinander abweichen (zum Beispiel in genau einem Zeichen) als 
gleich gewertet werden." 

Aus historischer Perspektive erscheint es unsinnig, beliebige Änderun- 
gen gleich zu behandeln: Es ist offensichtlich, dass bestimmte Abweichun- 
gen zweier Zeichenketten für einen gegebenen sprachlichen Kontext weni- 
ger auffällig sind als andere: Bis ins 17. Jahrhundert kann man davon 
ausgehen, dass „u“ und „v“ nur positional und nicht lautlich differenziert 
verwendet werden. Eine Abweichung von „vnnß“ zu „uns“ als pure Zei- 
chenkette ist mit einer Levenshtein-Distanz von 3 zu bewerten, obwohl „u“ 
und „v“, „$“ und „s“ sowie „nn“ und „n“ für den geübten Leser als iden- 


® Einen guten Überblick bis zum Stand 1995 gibt: AJ. Lait und B. Randell: An Assessment of 
Name Matching Algorithms [1995]. Adresse: http://homepages.cs.ncl.ac.uk/brian.randell/ home.- 
informal/Genealogy/NameMathing.pdf (letzte Einsichtnahme: 31.03.2006), die auch gleich eine 
weitere Variante (‚Phonex‘) beisteuern. 


" Der Algorithmus wurde veröffentlicht: Vladimir I. Levenshtein: Binary codes capable of correc- 
ting deletions, insertions, and reversals. In: Doklady Akademii Nauk SSSR 163 (1965). S. 845-848 
(Russisch). Englische Übersetzung in: Soviet Physics Doklady 10 (1966). S. 707-710. 
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tisch zu bewerten sind. Für das Niederdeutsche hat Jan Strunk einmal dar- 
aus die Konsequenz gezogen und einen Algorithmus vorgeschlagen, der 
diese in der Abstandsberechnung unterschiedlich gewichtet und insbeson- 
dere durch Berücksichtigung graphischer Varianzen signifikant bessere Su- 
chergebnisse erzielt.” 

Im oben angeführten hessischen Beispiel kommt jedoch keine dieser 
Techniken zum Einsatz. Statt dessen verwendet die Anwendung ein Ver- 
fahren, das aus der Computerlinguistik als ‚Stemming‘ bekannt ist. Dahin- 
ter verbirgt sich eine morphologische Lemmatisierung, die Flexionsformen 
eines Wortes auf ihr Grundwort zurückführt. Auch für das Lateinische 
existiert Software zur morphologischen Analyse, wie zum Beispiel ‚Lem- 
Lat‘ oder das ‚Perseus Word Study Tool‘.'” Diese Ansätze basieren ge- 
wöhnlich auf Lexika und Regelwerken zur Flexion, Präfix- und Suffixbil- 
dung. Damit verwendet diese Technik nicht nur inhärente Strukturen der 
Texte, die algorithmisch aufbereitet werden, sondern externes Wissen, das 
in Thesauri abgelegt ist. Dennoch sind die Verfahren des Stemming keine 
reinen Wortlisten, die ganze Flexionsparadigmen ihrem Grundwort zuord- 
nen, sondern Wörterbücher der Grundwörter mit formalisierten Angaben 
zur Morphologie, so dass der Computer jede mögliche Flexionsform des 
Wortes bilden kann. 

Es gibt aber auch Anwendungen, die ganze Wörter in Referenzlisten zu- 
sammenführen. Insbesondere prosopographische Arbeit hat Namenslisten 
erstellt, die leider nur selten öffentlich zugänglich sind: So sind die Register 
der jüngeren Bände des Repertorium Germanicum mit solchen Namenslisten 
entstanden. Auch die Namensdatenbanken, die im Zusammenhang mit 
dem Altdeutschen Namenbuch und dem Projekt Nomen et gens entstanden 
sind, sind nicht öffentlich verfügbar." Es ist offensichtlich noch nicht wahr- 


® Jan Strunk: Information retrieval for languages that lack a fixed orthography. Adresse: 
http://www.linguistics.ruhr-uni-bochum.de/-strunk/LSreport.pdf (letzte Einsichtnahme am 
21.04.2006). 


16 Adresse: http://webilc.ilc.cnr.it/-ruffolo/ (letzte Einsichtnahme am 20.04.2006). 


7 Adresse: http://www.perseus.tufts.edu/cgi-bin/morphindex?lang=la (letzte Einsichtnahme am 
20.04.2006). 


18 Nomen et gens: Adresse: http://www.nomen-et-gens.de/portal.asp (letzte Einsichtnahme am 
20.04.2006). Vgl. auch Redmer Alma: A multi-level database. Study on the elite of 15th and 16th 
century Groningen. In: Prosopography and Computer. Contributions of Medievalists and Mod- 
ernists on the Use of Computer in Historical Research. Leuven, Apeldoorn 1995. S. 185-194. — 
Didier F. Isel: Prosopographie des personnages mentionnés dans les textes pour l'époque de 
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genommen worden, dass diese Materialsammlungen nicht nur zur Vorbe- 
reitung onomastischer und prosopographischer Forschung dienen, sondern 
ein nutzbringendes Hilfsmittel darstellen können, Quellenaussagen aus 
den Zeichenketten ihrer digitalen Repräsentation zu ermitteln. Eine fach- 
spezifische Suchmaschine muss also den Versuch unternehmen, derartige 
Datenbestände zu nutzen. Es ist jedoch um vieles leichter, ‚Name Mat- 
ching‘-Algorithmen und approximative Verfahren beim Erstellen eines 
Index zu verwenden, da hier vorhandene oder einmal zu entwickelnde Al- 
gorithmen direkt in die Softwarearchitektur eingebaut werden, statt um- 
fangreiche Zugriffe auf bislang noch nicht einmal öffentliche externe 
Datensammlungen zu organisieren. 

Für eine historisch orientierte Suchmaschine wären demnach Algorith- 
men zu entwickeln. Das Untersuchungsobjekt ‚mittelalterliche und früh- 
neuzeitliche Urkunden’ würde zum Beispiel besonders zwei Verfahren er- 
fordern, eines für die graphischen Varianten des Mittellatein und eine für 
die des Frühneuhochdeutschen. 

Das DEEDS-Projekt, das umfangreiche mittellateinische Urkundentexte 
englischer Klöster digitalisiert hat, verwendet dafür ein existierendes Ver- 
fahren, den ‚Double Metaphone‘-Algorithmus, der einen echten phoneti- 
schen Ausgleich versucht.” Erfahrungen damit liegen derzeit noch nicht 
vor. Auf Grund der Erfahrungen von Jan Strunk, der die Qualität der Such- 
ergebnisse insbesondere durch Verfahren auf graphischer Ebene verbessert 
sieht, würde ich einen einfachen ‚Graphex’‘-Algorithmus vorschlagen, der 
fol-gende Regeln berücksichtigen würde: „h“ wird nicht berücksichtigt. 
„cio“ und „tio“ werden gleichbehandelt, „e“ „ae“ „oe“ und e-caudata wer- 
den gleichbehandelt, ebenso „i“, „y“ und „ii“. Für die Epenthese (zum Bei- 
spiel „damnum“ = „dampnum“) und die Assimiliation (zum Beispiel „auc- 
tor“ > „autor“) werden Ausgleichsklassen gebildet. 

Auch für das Mittelhochdeutsche wie für das Frühneuhochdeutsche 
existieren noch keine Ausgleichsalgorithmen. Ein ‚Graphex‘ dazu müsste 
die Konsonantenreduplikationen berücksichtigen, „v“ und „u“ sowie „ß“ 


Pépin le Bref et de son frère Carloman (741-768) spécialement ceux exerçant une fonction 
ecclésiastique ou laïque, Quatrième édition (mars 2006): Tableau de concordance entre noms et 
lemmes (Adresse: http://prosopographie-id.de/Tableau%20de%20concordance.htm). 

® Vgl. zum Algorithmus: Lawrence Phillips: The Double Metaphone Search Algorithm. In: 
C/C++ User Journal June 2000. Adresse: http://www.cuj.com/documents/s=8038/cuj0006philips/ 
(letzte Einsichtnahme am 31.03.2006). 
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und „s“ gleichbehandeln, „cz“ mit „z“ gleichsetzen und die Schreibweisen 
„ew“ und „aw“ mit den Diphtongen „eu“ und „au“ identifizieren.” 

Die Realität dialektal eingefärbter Urkundensprache des 14.-16. Jahr- 
hunderts würde auch ‚Soundex‘-ähnliche Ausgleichsmechanismen nahele- 
gen: p=b, mb=b, d=t, g=k=c=q sind geläufige lautliche Verwandschaften. Die 
deutsche Sprachgeschichtsforschung kennt noch eine größere Menge zeit- 
lich und geographisch begrenzter Abweichungen,” kann aber ohne ein ge- 
rade erst im Entstehen befindliches Corpus” noch keine genaueren Aussa- 
gen darüber treffen, wann wo welche Varianten auftreten. Ob also die Be- 
rücksichtigung dieser weitergehenden Varianten nutzbringend ist, bedarf 
genauer Evaluation. 

Mit derartigen Ausgleichsmechanismen besteht die begründete Hoff- 
nung, dass die Stichwörter aus dem aktuellen Wortschatz eines Historikers, 
in die er sein Forschungsproblem übersetzt und die er in eine mit diesem 
Mechanismen ausgestattete Suchmaschine eingibt, eine Sammlung auch or- 
thographisch und lautlich varianter Quellentexte ermittelt, die Auskunft zu 
seiner Frage geben, dass er also zum Beispiel Quellendokumente findet, die 
eine historische Schreibweise des gesuchten Personennames enthalten. 


4. Informationstypen 


Für historische Arbeit ist darüber hinaus aber noch eine Eigenschaft von 
Quellentexten zentral, die in einer Suche, die nur auf Zeichenketten orien- 
tiert ist, nicht möglich ist: die zeitliche Einordnung. Zeitliche Einordnung 
beruht nämlich auf numerischen Angaben. Für eine zeitliche Eingrenzung 
einer Suche auf Quellenmaterial aus der Zeit Ottos III. wären Quellentexte 
zu filtern, die Datumsangaben aus der Zeit zwischen 996 und 1002 enthal- 


” Eine Beispielimplementation für den mittellateinischen und den frühneuhochdeutschen Gra- 
phex und einen oberdeutschen Soundex in Visual Basic for Applications findet man unter 
Adresse: http://www.cei.lmu.de/examples/graphex.bas.zip (letzte Einsichtnahme am 01.05.2006) 


>! Vgl. zum Beispiel Frederic Hartweg und Klaus-Peter Wegera: Frühneuhochdeutsch. Eine Ein- 
führung in die deutsche Sprache des Spätmittelalters und der frühen Neuzeit (Germanistische 
Arbeitshefte 33). 2. überarb. Aufl. Tübingen 2005; Gerhard Philipp: Einführung ins Frühneuhoch- 
deutsche. Sprachgeschichte, Grammatik, Texte. Heidelberg 1980. 


2 Vgl. Deutsch Diachron Digital: Adresse: http://www2.hu-berlin.de/ddd/ (letzte Einsichtnahme 
am 20.04.2006) mit Links auf einzelne Teilprojekte (Adresse: http://www2.hu-berlin.de/ddd/ 
links.php). 
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ten. Ein Ausdruck „>995 und <1003” führt in alphanumerischer Ordnung, 
das heißt also in einer Ordnung rein nach Reihenfolge der einzelnen Zei- 
chen, zu keinem Ergebnis, denn es gibt kein Zeichen, das in alphanumeri- 
scher Reihung hinter „9“ und vor „1“ liegt. Ebenso sind Abweichungen, die 
über approximative Suchverfahren ausgeglichen werden, anders zu beur- 
teilen, indem die Änderung einer Stelle am Beginn einer Zahl eine weit grö- 
ßere Abweichung darstellt als am Ende einer Zahl. Ein fachspezifischer In- 
dex muss also zwischen alphanumerischen und numerischen Anfragen un- 
terscheiden. 

Zunächst erscheint die Unterscheidung leicht, da für beide Informati- 
onstypen bestimmte Zeichen reserviert sind: Ziffern und Buchstaben. Ich 
möchte das Problem gemischter Formen, lateinischer Zahlen und sprachli- 
cher Ausdrücke für Zahlenwerte beiseite lassen und das Problem ‚Zahl/ 
Wort‘ als allgemeineres Problem von Informationstypen weiterverfolgen. 

Viele der bislang angesprochenen Techniken erscheinen im historischen 
Alltag überflüssig: Um einen Bibliothekskatalog benutzen zu können, 
braucht der Forscher eine bibliographisch regelgerechte Referenz, die im 
20. Jahrhundert zum Standard wissenschaftlichen Arbeitens geworden ist. 
Eine Fußnote oder eine wissenschaftliche Bibliographie liefern mir also 
ausreichend Informationen, eine Angabe gemäß der strikten Regeln des 
Kataloges zu finden, ja sie sogar für meine Suche nutzbar zu machen, in- 
dem klare Ein- und Ausgrenzungen möglich sind. Auch die Suche im Find- 
buch im Archiv braucht in vielen Fällen keinen Ausgleich historischer 
Schreibweisen, denn es ist häufig genug von einem Zeitgenossen angelegt 
worden, der moderner Orthographie folgt - von den Findbüchern des 19. 
Jahrhunderts sei hier einmal abgesehen. Beide Informationsquellen haben 
jedoch in der Welt der Bibliotheken und des Internets eines gemeinsam: Sie 
sind ‚Metadaten‘, das heißt Angaben, die das eigentliche Objekt - das Ar- 
chival, das Buch - beschreiben. Damit sehen sie grundsätzlich anders aus 
als der eigentliche Text einer Quelle und sind ‚Informationstypen’ wie Zah- 
lenangaben oder geographische Angaben mit eigenen Eigenschaften. Wei- 
tere geläufige Informationstypen findet man in der Welt der gedruckten 
Bücher in den Registern: Ortsindex, Personenindex oder Sachindex sind al- 
les Texte, die eine bestimmte Information repräsentieren, die bei einer Su- 
che unterschiedlich ausgewertet werden kann. Die Funktionen dieser Infor- 
mationstypen sind in der elektronischen Welt über die Anwendungen 
sichtbar gemacht, in die sie eingebettet sind. So kann zum Beispiel der 
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Karlsruher Virtuelle Katalog Informationstypen in verschiedenen Datenbe- 
ständen zusammenfassen, indem er auf die standardisierten Schnittstellen 
der internationalen Bibliotheksanwendungen zugreift.” Eine fachspezifi- 
sche Suchmaschine kann das nicht, da die Anwendungen zur Präsentation 
der histori-schen Dokumente keine solchen Schnittstellen kennen. 


5. Strukturen 


Dennoch kann sie die Informationstypen unterscheiden. Die technische 
Entwicklung im WWW entfernt sich von HTML, der ‚HyperText Markup 
Language‘, die dem Internet in 1990er Jahren sein äußeres Gesicht gegeben 
hat. Auch wenn die Diskussion um das ‚Semantische Netz’ oder ‚Web 2.0 
nicht mehr die Feuilletons beherrscht, XML dominiert die technische Dis- 
kussion, wenn es um Publikationen im Internet geht. 

Die Phänomene HTML und XML werden in der Informatik unter dem 
Stichwort ‚Semistrukturierte Daten’ diskutiert. Darunter werden Phänome- 
ne zusammengefasst, die sich mit relationalen und objektorientierten Da- 
tenbanksystemen nicht oder nur ungünstig abbilden lassen, weil unüber- 
sichtlich komplexe Datenstrukturen entstehen und fehlende oder wieder- 
holte Informationstypen umfangreiche Leerstellen entstehen lassen. Die 
Textauszeichnungssprachen HTML und XML sind darüber hinaus so er- 
folgreich, weil sie nicht nur unregelmäßig strukturierte Daten abbilden 
können, sondern auch weil sie ‚selbstbeschreibend’ sind, das heißt, weil die 
strukturtragenden Daten Teil der Texte selbst sind.” 

Ein fachspezifische Suchmaschine wird also auf diesen Eigenschaften 
der Dokumente im Web aufbauen. Welche Konsequenzen das haben kann, 


3 Über den KVK: Adresse: http://www.ubka.uni-karlsruhe.de/hylib/virtueller_katalog.htmi (letz- 
te Einsichtnahme 20.04.2006). 


”* Der Einführungsvortrag zur Tagung .hist2003 widmete sich noch dieser Vision (vgl. Christoph 
Albrecht: Geschichte und Neue Medien. In: Geschichte und Neue Medien in Forschung, Archi- 
ven, Bibliotheken und Museen, Tagungsband .hist2003. Hg. von Daniel Burgkhardt und anderen 
(Historisches Forum 7). Berlin 2005. Adresse: http://edoc.hu-berlin.de/e_hist-for/7_/PHP/ 
Ueberblicke_7-2005-I.php#001001, letzte Einsichtnahme am 20.04.2006). Auf der Folgetagung 
‚hist2006 war das Stichwort jedoch aus den Titeln der Vorträge und Sektionen verschwunden 
(vgl. Adresse: http://www.clio-online.de/hist2006/texts/hist2006_programm.pdf, letzte Einsichtnah- 
me am 20.04.2006). 


® Vgl. zu den ‚Semistrukturierten Daten‘: Serge Abiteboul, Peter Buneman und Dan Suciu: Data 
on the Web. From Relations to Semistructured Data and XML. San Francisco 2000. 
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möchte ich an den mittelalterlichen und frühneuzeitlichen Urkunden deut- 
lich machen und bei einem Vorhaben beginnen, das zunächst wie das Ge- 
genteil einer Suchmaschine klingt, die automatisch historischen Texten 
wahrscheinliche sachliche Repräsentanzen zuordnet, ein Vorhaben, das je- 
doch Konzepte verdeutlicht, die in den Funktionsumfang einer solchen 
Suchmaschine nutzbringend eingebaut werden können. 

Die Charters Encoding Initiative (CEI)* ist eine Arbeitsgruppe, die sich im 
Frühjahr 2004 das Ziel gesetzt hat, einen Vorschlag für einen Textauszeich- 
nungsstandard für die Quellengattung ‚Urkunden des Mittelalters und der 
frühen Neuzeit’ zu machen. Ein solches Bestreben beruht auf den Beobach- 
tungen, dass erstens die Historiker, Archivare und Bibliothekare diese 
Quellengattung in größerem Maß digitalisiert und über das Netz zugäng- 
lich gemacht haben und dass zweitens die Urkunden strukturierter Er- 
schließung besonders zugänglich sind.” 

Die Arbeitsgruppe geht auf einem induktiven und auf einem dedukti- 
ven Weg zu einem gemeinsamen Textauszeichnungsstandard. Induktiv 
sind folgende zwei Maßnahmen: Die Arbeitsgruppe ermittelt erstens Ähn- 
lichkeiten vorhandener Schemata und analysiert zweitens die Arbeitspro- 
zesse bei der Arbeit mit Urkunden. Dabei ist deutlich geworden, dass die 
an unterschiedlichen Stellen unabhängig von einander entwickelten Daten- 
strukturen auffällig ähnlich sind. Diese Ähnlichkeit beruht nicht nur dar- 
auf, dass natürlich immer das gleiche Objekt beschrieben wird, sondern 
sogar in den Namen der Strukturelemente finden sich Ähnlichkeiten: Für 
Abkürzungen verwenden zum Beispiel die den Regeln der TEI angelehnten 
Editionen der Ecole nationale des chartes” ebenso <abbr> wie der Codice diplo- 
matico della Lombardia medievale.” 

Die Eigenschaft von XML-Dokumenten, ‚selbstbeschreibend’ zu sein, 
geht also teilweise so weit, dass unabhängig von einander entwickelte Da- 
tenstrukturen direkt übertragbar werden. Ein erstes Ziel der Arbeitsgruppe 


26 Adresse: http://www.cei.lmu.de (letzte Einsichtnahme am 20.04.2006). 


” Vgl. Georg Vogeler und Patrick Sahle (Hg.): Virtual Library Historische Hilfswissenschaften, 
Sektion Diplomatik. Adresse: http://www.vl-ghw.Imu.de/diplomatik.html (letzte Einsichtnahme 
am 20.04.2006). 


28 Adresse: http://elec.enc.sorbonne.fr (letzte Einsichtnahme am 21.04.2006). Die XML-Daten die- 
ses Projektes sind über die Webseite nicht einsehbar. 


® Adresse: http://cdlm.unipv.it (letzte Einsichtnahme am 21.04.2006). XML-Daten können in die- 
sem Projekt über die Suchfunktion (‚Mostra la marcatura XML‘) auch über die Webseite eingese- 
hen werden. 
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ist es deshalb, einen gemeinsamen Wortschatz für die Auszeichnung von 
digitalen Urkundenrepräsentationen bereitzustellen.” 

Der deduktive Weg geht von einer internationalen Terminologie der Di- 
plomatik aus.” Das Vocabulaire Internationale de Diplomatique ist nämlich 
nicht nur ein Wörterbuch, das die in 12 europäischen Sprachen und im La- 
teinischen üblichen Fachausdrücke zur Beschreibung von Urkunden und 
ihrer Entstehung zusammenstellt, sondern bildet durch seinen systemati- 
schen Aufbau auch eine Struktur diplomatischer Informationen ab.” 

Eine fachspezifische Suchmaschine wird sich also an diesen Strukturen 
orientieren. Sie wird die existierenden Strukturen aus den Dokumenten 
auslesen und sie mit den vorhandenen Strukturen der CEI vergleichen. Ob- 
wohl zurzeit noch Handarbeit notwendig ist, erscheint es möglich, mit Hil- 
fe des Vocabulaire Internationale de Diplomatique auch XML-Struktu-ren der 
Ausgangsdokumente automatisch auf einen Standard nach den Vorgaben 
der CEI abzubilden. 

Dabei entstehen im Index der Suchmaschine natürlich sehr ungleiche 
Strukturen. Welche Bedeutung kann man dann den Strukturen noch zu- 
messen? Zunächst einmal wird aus den existierenden Beispielen deutlich, 
dass eine fachspezifische Suchmaschine in Datenbeständen sucht, nicht in 
Webdokumenten. Das heißt die Suchmaschine wird versuchen, das einzel- 
ne Dokument aus der Struktur der Datei zu filtern und dafür die Trefferge- 
nauigkeit auszuwerten. 

Eine ganz neue Perspektive ergibt sich, wenn man sich an Diskussionen 
im Bereich ‚Information Retrieval‘ heranwagt. Neben Überlegungen, auch 
die Semantik eines Textes mit in die Suche einzubeziehen, die neben den 
oben angeführten Verfahren unter dem Stichwort ‚Textmining‘ komplexe 
Konzepte entwerfen, die Bezüge und Bedeutungen von Wörtern formal ab- 
zubilden, konzentriert sich ein Strang der Diskussion auf die Strukturen.” 


® Vgl. den Vorschlag unter Adresse: http://www.cei.Imu.de/taglibrary.html (letzte Einsichtnahme 
am 21.04.2006). 


"I Vocabulaire international de la diplomatique. Hg. von Maria Milagros Cárcel Ortí (Collecci6 
Oberta). 2. verbesserte Auflage. Valencia 1997. 

%2 Vgl. dazu auch Michele Ansani: Diplomatica (e diplomatisti) nell'arena digitale. In: Archivio 
storico italiano 158 (2000). S. 349-379, auch in: Scrineum 1 (1999). S. 1-11 (Adresse: http://dobec. 
unipv.it/scrineum/ansani.htm, letzte Einsichtnahme am 05.03.2000). 

® Vgl. Norbert Fuhr: Information Retrieval Methods for Literary Texts. In: Jahrbuch für Compu- 
terphilologie 5 (2003). S. 147-160 (online unter Adresse: http://computerphilologie.uni-muen- 
chen.de/jg03/fuhr.pdf, letzte Einsichtnahme am 21.04.2006). 
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Welche Bedeutung die Strukturen für die Bewertung eines Treffers ha- 
ben können, kann gut am Urkundenbeispiel erläutert werden. Volkssprach- 
liche mittelalterliche Urkunden sind nämlich nicht nur Quellen für Histori- 
ker, sondern auch hochgeschätzte Quellen für die Sprachgeschichte, die in 
ihnen regional und zeitlich klar zugeordnete Textzeugen findet. Das Such- 
interesse des Sprachhistorikers ist so in vielen Fällen ein gänzlich anderes: 
Zwar sucht er auch nach Urkunden, aber er sucht nach Urkundentexten, 
nicht nach Urkunden als Zeugnissen von Sachverhalten. Ja sogar die oben 
angeführten Verfahren, variante Darstellungen von Wörtern mit ihren mo- 
dernen Formen in Übereinstimmung zu bringen, sind für den Sprachistori- 
ker nicht notwendigerweise neue Zugänge zu bislang verschlossenen Infor- 
mationen, sondern sie können ebenso auch Unterscheidungen überdecken, 
die zentral sind für die Anfrage. 

Für ein konkretes Projekt einer fachspezifischen Suchmaschine können 
diese unterschiedlichen Suchinteressen durch unterschiedliche Anfragesei- 
ten berücksichtigt werden.” Es kann aber auch eine andere Erkenntnis dar- 
aus verallgemeinert werden: Moderne Suchausdrücke für historische Sach- 
verhalte sind in den Originaltexten seltener und ungenauer zu erwarten als 
in den Metadaten, die sprachlich normalisiert sind. Eine historische Anfra- 
ge an ein digitales Urkundencorpus wird deshalb Treffer in den Kopfreges- 
ten höher bewerten als Treffer im Editionstext. Die aus XML-Dokumenten 
ermittelbaren Datenstrukturen liefern also nicht nur Hinweise auf die Da- 
tentypen und die darauf anzuwendenden Werkzeuge graphematischer, 
phonetischer und lexikalischer Konkordanz, sondern auch Hinweise auf 
die Relevanz eines Treffers für die Anfrage. 


6. Fazit 


Zunächst sei festgestellt, dass die angesprochenen Instrumente keineswegs 
eindeutige, positivistische Sachaussagen aus den Quellentexten werden er- 
mitteln können. Die Frage- und Deutungskompetenz der Historiker stellt 
eine fachspezifische Suchmaschine nicht in Frage. Sie liefert ihm ein Hilfs- 


= Vgl. Georg Vogeler: Europäisches Urkundenerbe. Zu Potentialen und Perspektiven eines inter- 
nationalen Fachinformationssystems digitaler Urkundenpublikationen. In: Elektronische Fachin- 
formationssysteme in der Geschichte, Jahrestagung der AGE, 25.-26.11.2006. Hg. von Franz 
Götz. München 2006 (im Druck). 
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mittel an die Hand, das Heterogenitäten der Quellencorpora verringert — 
und damit die Menge der relevanten Dokumente erhöht (recall) - und die 
Relevanz der Treffer für eine historische Anfrage besser sichtbar macht - 
und damit den Anteil an irrelevanten Treffern, die der Suchende verarbei- 
ten muss, verringert (precision). 

Eine derartige Suchmaschine muss aber mit zwei Problemen fertig wer- 
den: 


1. Die oben beschriebenen Werkzeuge entfalten ihre Wirkung erst, wenn 
sie auf passende Texte angewendet werden: Ein für frühneuhochdeut- 
sche Texte getrimmter ‚Graphex’ wird auf altfranzösische Texte ange- 
wendet kaum sinnvolle Ergebnisse liefern. Sowohl die Implementierung 
des im Eingang dieses Textes erwähnten aber nicht weiterverfolgten 
Crawlers, wie die Analyse der gefundenen Texte, müssen darauf geprüft 
werden, ob es Instrumente gibt, die Sprache der Texte plausibel zu be- 
stimmen. Im hier verfolgten Testszenario mittelalterlicher und frühneu- 
zeitlicher Urkundencorpora haben wir es noch nicht mit den Material- 
mengen zu tun, die dazu zwingen, diesen Schritt zu automatisieren. Vor- 
läufig wird die Suchmaschine mit den Corpora von Hand gefüttert, das 
heißt vor der Indexierung des Corpus kann der Bearbeiter entscheiden, 
welche Art von Transformationen angewendet werden soll. 

2. Die Vielzahl der Techniken ist hier weitgehend theoretisch beschrieben. 
Es gibt einzelne Evaluationen der vorgestellten Techniken,” aber viele 
sind auch noch nicht evaluiert, ja noch nicht einmal implementiert. Das 
sind insbesondere die Techniken, die sich mit mittelalterlichen und früh- 
neuhochdeutschen Sprachständen europäischer Volkssprachen und des 
Lateinischen beschäftigten, mithin also mit genau den Sprachen, die im 
Testcorpus vorherrschen. Es ist also im Rahmen der Tests ein Beispielcor- 
pus zu bilden, in dem die maximale Trefferpräzision und der maximale 
Trefferumfang bestimmbar ist, um die mithilfe der existierenden und zu 
entwickelnden Verfahren mögliche Präzision und Trefferumfang damit 
vergleichen zu können. 


Als vorläufiges Fazit bis zur technischen Vollendung der Anwendung” 
kann man aber Folgendes sagen: Die Qualität einer fachspezifischen Such- 


3 Zum Beispiel Strunk, wie Anm. 15, oder Liar-Randell, wie Anm. 13. 
% Vgl. dazu den folgenden Beitrag von Markus Heller. 
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maschine für Historiker beruht nicht so sehr darauf, dass die Anbieter um- 
fangreiche Tiefenerschließung leisten und inhaltliche Normen zum Beispiel 
in gemeinsamen Thesauri verwenden, sondern zum einen auf einer techni- 
schen Entscheidung auf Seiten der Anbieter und zum anderen auf fachspe- 
zifischer Softwareentwicklung auch im Bereich der Suchmaschinenindices. 
Die Anbieter wären darauf zu verpflichten, dass die Datenstrukturen von 
der Suchmaschine ausgelesen werden können, das heißt dass die Informa- 
tionen möglichst so in XML-Formaten auf den Servern abgelegt werden, 
dass die Suchmaschine Zugriff auf die XML-Rohdaten bekommt, sowie 
dass die Daten mit gemeinsamen XML-Vokabularien beschrieben werden. 
Die Fachinformatiker tragen zum Erfolg einer fachspezifischen Suchma- 
schine bei, indem sie die notwendigen ‚Übersetzungstools‘, wie Lemmati- 
sierung, Graphienausgleich, Lautausgleich, Approximation, wo nötig ent- 
wickeln, auf jeden Fall testen und schließlich in die Suche integrieren. 


Fachspezifische Indexierung von historischen 
Dokumenten II 


Ein Framework zur approximativen Indexierung 
semistrukturierter Dokumente 


Markus Heller 


1. Einleitung 


Die Nutzung von Rechnern in den Geschichtswissenschaften ist inzwi- 
schen weit verbreitet: Niemand schreibt seine Aufsätze mehr mit der 
Schreibmaschine und jeder speichert seine Entwürfe digital auf Datenträ- 
gern. Auch Quellen werden inzwischen mit Computern bearbeitet: Man be- 
dient sich generischer Programme aus den Office-Schienen der großen Her- 
steller und baut auf diese Weise seine Corpora auf. 

Solange derartige Editionsansätze auf ein lokales Nutzerumfeld be- 
schränkt bleiben, mag der fehlende methodische Ansatz im Umgang mit 
diesen Ressourcen den geringen Einsatz rechtfertigen. Auf diese Weise ist 
jedoch in den vergangenen Jahren eine bunte Landschaft von hinsichtlich 
der Datenformate inkompatiblen und höchst heterogenen Datenbeständen 
gewachsen, wobei die Nutzbarkeit der Daten durch zukünftige Historiker- 
generationen alles andere als gesichert ist. Sind heute schon die älteren 
Winword-Dateiformate mit aktueller Software vom gleichen Hersteller 
nicht mehr lesbar, so tritt dieses Problem bei unterschiedlichen Herstellern 
mit proprietären Datenformaten noch in viel schärferer Form auf. Das oft- 
mals fehlende Bewusstsein, auf offene Speicherformate und Standards zu 
setzen, gleicht einer fahrlässigen Strategie, öffentliches Geld und die wert- 
volle Lebenszeit vieler Quelleneditoren gleichsam zu vergeuden. Stattdes- 
sen liegt es nahe, wenn Editionsprojekte bei der Entscheidung über die Fi- 
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nanzierung maßgeblich dahingehend beurteilt werden, wie sehr sie sich 
der Forderung beugen, dass sie unabhängig von ihrer geographischen 
Speicherung und unabhängig vom zukünftigen Bearbeitungswerkzeug des 
Benutzers durchsucht werden können. 

Dieses Szenario verlangt nach einer verteilten Sucharchitektur, in der die 
Daten in einem offen gelegten Format vorgehalten, zentral indexiert und 
mit einer ebenfalls zentralen Schnittstelle durchsuchbar gemacht werden. 
Dabei wird auch deutlich, dass die allgemein öffentlich verfügbare Such- 
technik von Google, Yahoo und Co. deutliche Schwächen aufweist: Sie sind 
auf verlinkte Webseiten unstrukturierten Inhalts spezialisiert und nehmen 
keinerlei Rücksicht auf Dokumente mit Auszeichnungen und hinterlegten 
fachlichen Zusatzinformationen. Die Merkmale solcher semistrukturierter 
Dokumente können bislang bei der Suche nicht angegeben werden. Auch 
in Bezug auf den Inhalt der Dokumente zeigen sich Probleme: Falls ein 
Name oder eine Bezeichnung in einem Dokument auch nur geringfügig ab- 
weichend von der Suchanfrage geschrieben wird, besteht mit der gegen- 
wärtig öffentlich verfügbaren Suchtechnik keine Möglichkeit, diese Stellen 
zu finden. 

Es wird also deutlich, dass ein dringender Bedarf zur Entwicklung von 
Suchmaschinentechnologien besteht, um die Arbeit der Editoren von heute 
nicht wertlos erscheinen zu lassen. 


2. Problemstellung 


Die zu beschreibenden Probleme beginnen bei der Erfassung der Texte: Als 
Speicherformat bieten sich verschiedene XML-Standards an, wie etwa bei 
mittelalterlichen Urkunden der Standard CEIL’ XML-TIexte weisen jedoch 
selten eine Verlinkungsstruktur ähnlich der von HTML-Texten auf, ob- 
gleich dies grundsätzlich möglich wäre: XHTML ist eine völlig XML-kon- 
forme HTML-Variante. Ein Crawler, der alle Dokumente in einem im Inter- 


1 Adresse: http://www.cei.lmu.de/ (letzte Einsichtnahme am 17.05.2006). Zudem: Georg Vogeler: 
Europäisches Urkundenerbe. Zu Potentialen und Perspektiven eines internationalen Fachinfor- 
mationssystems digitaler Urkundenpublikationen. In: Elektronische Fachinformationssysteme in 
der Geschichte. Jahrestagung der AGE, 25.-26.11. 2005. Hg. von Franz Götz. München 2006 (im 
Druck). 
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net verteilten Corpus erschießt, kann nur jene Dokumente finden, die von 
anderen Dokumenten aus referenziert und verlinkt sind. 

Hinsichtlich der Techniken des Information Retrieval muss zum Ver- 
ständnis der Technologie erklärt werden, dass eine Suchmaschine nicht erst 
zum Zeitpunkt der Anfrageverarbeitung beginnt, Dokumente zu suchen. 
Vielmehr gleicht eine Suchmaschine einem System, das einen Index eines 
Buches erstellt. Der Index wird lange vor dem Suchzugriff erstellt und zum 
Zeitpunkt der Anfragebearbeitung nur abgefragt. Aus diesem Grund un- 
terscheidet sich jede Suchmaschinentechnologie konzeptionell von den 
klassischen Suchverfahren. Auch reguläre Ausdrücke dienen in erster Linie 
einer linearen Suche, und nicht einem Look-up in einem Index. Aus diesem 
Grund konzentriert sich unser Projekt nicht auf die Entwicklung von Such- 
verfahren, sondern auf Verfahren, in einem Index auf effiziente Weise die 
entsprechenden Einträge zu finden. 

Bei flachen Texten gleicht nun die Dokumentenverarbeitung einer Such- 
maschine der Erstellung eines Buchindizes. Doch XML-Iexte weisen ein 
weiteres zentrales Merkmal auf, in dem sie sich von flachen Texten unter- 
scheiden: Sie enthalten eine Struktur, anhand derer die verschiedenen Text- 
blöcke ausgezeichnet und beschrieben werden. Mit Blick auf historische 
Quellentexte können mit derartigen Textstrukturen einerseits tatsächliche 
Eigenschaften und Gliederungsmerkmale des Originals, aber auch Hinwei- 
se eines Editors, Übersetzungen, Referenzen auf die Sekundärliteratur so- 
wie auf andere Dokumente enthalten sein. Es liegt nun nahe, dass eine 
Suchmaschine zwischen all diesen verschiedenen Texttypen unterscheiden 
können sollte. Wer ausschließlich nach Originaltexten sucht, sollte aus- 
schließlich Stellen in diesem Texttyp angeboten bekommen. 

Interessant ist in diesem Kontext auch, dass Editoren zwar an die Ein- 
haltung ihrer spezifischen XML-Syntaxdefinition (‚Schema‘, oder ‚Docu- 
ment Type Definition‘, bzw. DTD) gebunden sind, diese aber durchaus 
enorme Freiheitsgrade definieren kann. So kann ein XML-Schema unter- 
schiedliche Auszeichnungstiefen zulassen. Es sind auch Rekursionen an 
Auszeichnungsmerkmalen möglich. Ebenfalls genannt werden muss an 
dieser Stelle die Tatsache, dass ein Ersteller eines Schemas die Semantik der 
Tags frei wählen kann. Wenn etwa ein Tag ‚document‘ definiert werden 
sollte, und damit gemeint ist, dass in jedem Tag ein einzelnes Quellendoku- 
ment abgelegt werden darf, dann tritt die Situation ein, dass eine solche 
XML-Datei mehrere Quellendokumente enthält. Die Identität zwischen 


62 Markus Heller 


‚Datei‘ und ‚Dokument‘ ist definitiv nicht mehr zwingend gegeben. Dies 
bedeutet, dass eine Suchmaschine für XML-Texte nicht Dateien finden will, 
sondern Stellen in einem XML-Corpus. 

Im Allgemeinen wird von den Auszeichnungselementen in XML-Datei- 
en von ‚Struktur‘ und von den Textinhalten von ‚Content‘ gesprochen. Wir 
haben nun bisher die Struktur betrachtet. Doch auch der Content weist Ei- 
genschaften auf, welche klassische Suchmaschinen an den Rand ihrer Fä- 
higkeiten führen. Betrachten wir die Lebensgeschichte des Till Eulenspiegel. Es 
handelt sich dabei um ein frühneuhochdeutsches Textbeispiel, das zu die- 
ser Zeit weite Verbreitung fand und auch heute noch allgemein bekannt ist. 
Die elektronische Fassung eines Drucks von 1540° enthält dabei folgende 
Schreibungen desselben Namens: 


— Ulenspiegel 288 
— Ulenspiegels 6 
— Ulenspiegeln 1 
— Ulenspieg 1 

— Uinspiegel 708 
— Ulnspiegels 11 


- viInspiegel 1 
IInspiegls 1 


- Ulnspiegeln 1 
— Ulnspiegl 1 


Flexionen werden in dieser Aufzählung unterschieden, weil wir in erster 
Linie von einer Suchmaschine ausgehen, die keinerlei approximative Ei- 
genschaften hat. Anhand dieses Beispiels wird die Eigenschaft von alten 
Texten deutlich, dass eine Orientierung an scheinbar verbindlichen Stan- 
dards nicht angenommen werden kann.’ Vielmehr ist zu beobachten, dass 


? Adresse: http://www.eulenspiegel.is.guad.de/ (letzte Einsichtnahme am 17.05.2006). 


° Ob dies angesichts der häufig revidierten Vorgaben der neuen deutschen Rechtschreibung an- 
genommen werden kann, wäre eine zu weit führende Diskussion. Das Problem selbst ist doch 
im Grundsatz noch präsent. Ein Ansatz für einen Indexer für eine orthographisch nicht standar- 
disierte Sprache findet sich hier: Jan Strunk: Information retrieval for languages that lack a fixed 
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eine Normierung von Schreibweisen erst mit der breiten Verfügbarkeit der 
Wörterbücher der Gebrüder Grimm (begonnen in der ersten Hälfte des 19. 
Jahrhunderts) und Johann Christoph Adelung (Ende 18. Jahrhundert) fest- 
gestellt werden kann. Die Eigenschaft der Informatik, grundsätzlich von 
‚sauberen‘ und normierten Daten auszugehen, führt hier nicht weiter. Auch 
Google unterliegt diesem Phänomen: Bei der Eingabe von ‚Schiffahrt‘ und 
‚Schifffahrt‘ erhält man unterschiedliche Treffermengen. Mit Blick auf den 
Content von in XML-Dateien erfassten Quellentexten sind jedoch Ansätze 
vonnöten, die in der Lage sind, abweichende Schreibungen ebenfalls zu fin- 
den. Diese Forderung entspricht dem Postulat der deskriptiven Linguistik, 
die versucht, die Sprachstände abzubilden und so zu akzeptieren, wie sie 
in den Quellen vorgefunden werden. Eine zu Recht stark kritisierte prä- 
skriptive Linguistik würde versuchen, den Quellentexten ex post eine 
Norm überzustülpen, die der diachronen, aber auch der synchron-dialekto- 
logischen Variabilität der deutschen Sprache nicht gerecht wird. 

Zuletzt muss sich inzwischen jede Suchmaschine an den Interessen des 
Benutzers orientieren: Google versucht, über Gmail Interessenprofile der 
Nutzer zu gewinnen, und auf diesem Weg ein Ranking anzubieten, das den 
Neigungen des Gmail-Benutzers entgegenkommt. Die anonyme Such- 
schnittstelle ist dagegen nicht personalisiert, wo gleich bei einigen Herstel- 
lern dennoch über Cookies versucht wird, mehr über die Interessenlagen 
der Benutzer zu erfahren. 

Eine Suchmaschine für historische Texte hat im Wesentlichen drei Nut- 
zergruppen: Historiker, Diplomatiker und Linguisten. Jede der Benutzer- 
gruppen hat ihr eigenes Interessenprofil: 


— Der Historiker interessiert sich in erster Linie für Inhalte von Urkunden, 
aber auch für Interpretationen und Einordnungen, die von einem Editor 
vorgenommen wurden. Weniger interessant sind Informationen über 
die äußere Form von Dokumenten. Eine approximative Suche ist schon 
mit Blick auf verschiedene Schreibweisen von Namen unabdingbar. 

- Der Diplomatiker interessiert sich weniger für den Inhalt, dafür aber für 
Informationen zur Erstellung und zur äußeren Form. Da modern- 
sprachliche Anmerkungen sich eher einer orthographischen Norm un- 
terwerfen als alte Texte, ist ein approximativer Zugriff nicht von dersel- 


orthography. 2003. Adresse: http://www.linguistics.ruhr-uni-bochum.de/-strunk/LSreport.pdf 
(letzte Einsichtnahme: 21.4.2006). 
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ben herausragenden Bedeutung wie bei Originaltexten. Dennoch ist 
eine Approximation in vielen Fällen hilfreich. 

- Der Linguist interessiert sich bei einem synchronen Erkenntnisziel für 
verschiedene Schreibungen und Aussprachen in Bezug auf eine regiona- 
le Verteilung. Bei diachronen Fragestellungen ist von Interesse, wie sich 
bestimmte Begriffe unter Einschränkung auf bestimmte Regionen in ih- 
rer Form verändert haben. Dabei ist denkbar, dass einerseits approxima- 
tive Fragestellungen, aber auch die Suche nach bestimmten Einzelfor- 
men von Interesse sein können. Weniger von Interesse ist für Linguisten 
die Suche in Annotationen. 


Auf jeden Fall wird deutlich, dass bei einer Suchmaschine für semistruktu- 
rierte alte Texte der Einsatz von Approximation vom Benutzer steuerbar 
sein muss. Hinsichtlich der Gewichtung von Feldern sollte der Benutzer 
eine Möglichkeit geboten bekommen, ein seinen Interessen entsprechendes 
Profil auszuwählen. Die Approximation erfolgt dabei stets bezogen auf den 
Content. Der Strukturanteil der Suchanfrage wird dabei durch den Suchen- 
den entweder fest vorgegeben oder in Teilen völlig freigestellt. 

Neben einer direkten, einstufigen Suche besteht ein weiteres Suchschema 
in dem Ansatz, dass ein Benutzer nicht explizit nach einem bestimmten Be- 
griff sucht, sondern dass er einen Sammelbegriff eingibt, um in einem 
zweiten Schritt seine Suche einzugrenzen. Die Funktion, die diese Möglich- 
keit zur Verfügung stellt, wird ‚Dynamic Drilldown’ genannt und wird von 
‚FAST Data Search‘, aber auch von der Suchimplementierung von Exalead’ 
geboten. Sie setzt voraus, dass Extraktoren definiert wurden, die bestimmte 
Dokumenteneigenschaften oder Entitäten mit einer bestimmten Eigen- 
schaft auszeichnen. Wie bei Exalead sind ‚Drilldowns’ auf Eigennamen, 
Ortsnamen, Regionen, Sprachen, Dokumententypen, Archive usw. möglich. 
Ein derartiger Zugriff würde der Fragestellung entgegenkommen, nach der 
ein Historiker etwa mehr über das geographische oder personelle Umfeld 
einer Person oder eines Vorgangs wissen will. 

Das bislang bezeichnete Szenario ist sehr umfangreich und im Rahmen 
eines kleinen Projekts nur äußerst bedingt umsetzbar. Mitunter aus diesem 
Grund haben wir uns entschlossen, nur die wesentlichen Technologiefra- 
gen zu klären und Themenbereiche auszuklammern, von denen wir über- 


* Adresse: http://www.fastsearch.no (letzte Einsichtnahme am 17.05.2006). 
5 Adresse: http://www.exalead.com (letzte Einsichtnahme am 17.05.2006). 
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zeugt sind, dass sie weit über den fachlichen Horizont der Computerlin- 
guistik bzw. Historischen Fachinformatik hinausführen. Darunter fällt bei- 
spielsweise die gesamte Fragestellung um die Erschließung verteilter Cor- 
pora: Wir gehen davon aus, dass die Texte bereits vorliegen. Ein weiterer 
Bereich, der besonders von Usability-Spezialisten gelöst werden muss, ist 
jener des Benutzerfrontends. Da die Firma Arpa Data GmbH? Interesse an 
einer Softwarebibliothek hat, die in die bestehende OCR-Lösung integriert 
werden kann, wollen wir uns darauf beschränken, ein objektorientiertes 
Framework zu entwickeln, mit dem die bezeichneten Fragestellungen des 
Information Retrieval grundsätzlich und für unsere Belange exemplarisch 
gelöst werden können. 


3. Projektbeschreibung 


Das beschriebene Projekt hat sich zum Ziel gesetzt, eine Indexierungsarchi- 
tektur zu entwickeln, die gemischte, also Content- und Strukturanfragen 
(‚CAS-Queries‘) beantworten kann, wobei der Content-Anteil über Appro- 
ximationsverfahren im Zugriff auf den Index aufgeweicht werden soll. Auf 
diese Weise können Anfragen bearbeitet werden, deren Strukturanteil sich 
auf die Auszeichnung durch einen Fachmann bezieht, und deren Content- 
Anteil mit möglichen abweichenden Schreibungen in Deckung gebracht 
werden kann. 

Es gibt bereits seit einigen Jahren Datenbanksysteme, die nativ mit 
XML-Texten umgehen und CAS-Abfragen beantworten können.” Aller- 
dings ist zu beobachten, dass bis dato keine XML-Datenbanken oder native 
XML-Indizes bekannt sind, die eine Approximation auf den Content- oder 
Strukturanteil implementieren. Unsere Entscheidung, einen eigenen Index 
zu entwickeln, lag darin begründet, dass der Aufwand, eine etablierte Mat- 
ching-Engine® einer Datenbank auf approximative Fähigkeiten hin zu er- 
weitern, im Arbeitsumfang schwer kalkulierbar ist. Es besteht das nicht un- 


6 Adresse: http://www.arpa.ch (letzte Einsichtnahme am 17.05.2006). Arpa Data beschäftigt sich 
vor allem mit der OCR-technischen Erfassung von Zeitungsarchiven. 


7 Vgl. Harald Schöning: Tamino - A Database System Combining Text Retrieval and XML. In: In- 
telligent Search on XML Data. Applications, languages, models, implementations, and bench- 
marks. Ed. by Henk Blanken. Berlin 2003. S. 77-94. Auch: Cynthia M. Saracco: Query DB2 XML 
Data with SQL 16.03.2006. Adresse: http://www-128.ibm.com/developerworks/db2/library/ 
techarticle/dm-0603saracco2/ (letzte Einsichtnahme 06.04.2006). 
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erhebliche Risiko, dass ein neues Release aus dem Hause des Herstellers 
die hinzugefügten Approximationsfunktionen nicht unterstützt oder die 
Modifikationen inkompatibel sind. Aus diesem Grund haben wir uns zu ei- 
ner Eigenentwicklung entschlossen, zumal ein großer Teil der benötigten 
Teilalgorithmen an unserem Institut oder in Kooperation entwickelt wur- 
den. Durch die Möglichkeit, die Rahmenbedingungen der Architektur 
selbst zu definieren, konnten wir auch die Anforderungen aus dem Retrie- 
val in historischen Textcorpora einfließen lassen. 

In Bezug auf historische Texte ist erkennbar, dass die Contentapproxi- 
mation nicht nur alphabetisch, sondern auch gesondert numerisch erfolgen 
muss, wenn etwa nach Dokumenten um das Jahr 1400 gefragt wird: Es ist 
neben dem alphabetischen ein weiterer Lookup für Zahlen und Jahresanga- 
ben erforderlich. Über eine konfigurationsgesteuerte Anwahl eines be- 
stimmten Indextyps werden als Zahlen erkannte bzw. in Zahlen konvertier- 
te Entitäten typenorientiert geroutet. Die Unterscheidung ist aus dem 
Grund wichtig, weil sich bei einer alphabetischen Approximation die Feh- 
lerschwere zwischen den verschiedenen Stellen eines Wortes kaum unter- 
scheidet. Bei Zahlen ist die Fehlerschwere aber sehr wohl an die Stelle ge- 
bunden, denn der Unterschied zwischen „1991“ und „1992“ ist eher gering 
und zwischen „1004“ und „2004“ doch enorm. Außerdem ist die stellenin- 
härente Approximation ebenfalls eine andere: Wenn man annimmt, dass 
ein falscher Buchstabe mit einem Fehlermaß des Wertes 1 belegt wird, so ist 
das Wort womöglich nicht mehr im Wortschatz der Sprache enthalten und 
‚falsch‘. Eine Jahreszahl wird anders,hingegen nie falsch sein. 

Es ist durchaus denkbar, neben dem Wort- und dem numerischen Index 
einen dritten Typ zu entwickeln: Ein geographischer Index könnte auf Ko- 
ordinaten Bezug nehmen und eine geographische Näherung bereitstellen. 
Man könnte also eine Suche auch auf Dokumente mit einem Bezug auf ge- 
wisse Orte eingrenzen. Gerade im Bereich der Wirtschafts- und Sozialge- 
schichte erscheinen solche Anwendungsgebiete sehr viel versprechend, be- 
rücksichtigt man doch, dass in der letzten Zeit sehr viele Ansätze über GIS- 
Anwendungen vorgestellt worden sind. Besonders zur XVI International 
Conference of the Association for History and Computing 2005 in Amsterdam 


Ë Erst jüngst ist bekannt geworden, dass der Datenbankhersteller MySQL eine Schnittstelle für 
die Einbindung von Storage Engines von Drittanbietern definieren will: Datenbank MySQL will 
mehr Storage-Engines einbinden. Heise-News, 26.04.2006. Adresse: http://www.heise.de/ 
newsticker/meldung/72417 (letzte Einsichtnahme am 17.05.2006). 


Fachspezifische Indexierung von historischen Dokumenten II 67 


konnten viele Projektberichte zu GIS-Themen beobachtet werden.’ Aller- 
dings wird im Rahmen des Projekts eine derartige Erweiterung aus Kapazi- 
tätsgründen nicht verfolgt. 

Im Bereich der Stringologie wird das hier offenkundige Problem ‚the 
nearest neighbour problem’ genannt. Allerdings ist nicht nur der nächst- 
beste Treffer gesucht, sondern alle Stellen im Corpus, die in bestimmten 
Editierdistanz-Grenzen die in der Anfrage genannten Anforderungen erfül- 
len. Die Approximation darf hier nicht wie in den meisten der bislang in 
der Literatur beschriebenen Approximationsverfahren auf einer linear ver- 
gleichenden Suche aufbauen." 

Das Ergebnis ist meist eine längere Ergebnisliste, wobei die Errechnung 
des Rankings in zwei Stufen erfolgt: Die erste Sortierung der Dokumente er- 
folgt dokumentenspezifisch, wobei bereits zum Zeitpunkt der Befüllung im 
Index anhand von Berechnungen zur Relevanz eines Terms in Bezug auf den 
Container, das Gesamtdokument und den Gesamtcorpus mittels TF/IDF-Ver- 
fahren festgelegt wird, wie relevant es in Bezug auf andere Container ist. 

Es entsteht also bereits zum Zeitpunkt der Befüllung (‚Feeding’) ein gro- 
bes Ranking innerhalb kriteriengleicher Ablagen auf der Platte. In einem 
zweiten Schritt, der erst zum Zeitpunkt der Anfragebearbeitung erfolgt, 
wird anhand eines Gewichtungsprofils von Containertypen errechnet, wie 
die Treffermenge sortiert werden muss. Das Gewichtungsprofil entspricht 
den Anforderungen der unterschiedlichen Interessenlagen der Benutzer. 
Hier werden die Interessen des Historikers, des Linguisten oder des Diplo- 
matikers abgebildet. Die bezeichneten Profile sind jederzeit änderbar, ohne 
dass der Index neu erstellt werden muss. 

Da vorab nicht bekannt sein kann, für welche Dokumente die Sucharchi- 
tektur als solche eingesetzt werden wird, haben wir uns entschieden, dem 
Beispiel der FAST-Suchmaschine folgend einen modularen Verarbeitungs- 
ansatz zu wählen. Es ist dem Betreiber überlassen, die Dokumentenverar- 
beitung so zu konfigurieren, wie es den Eigenschaften des Corpus ent- 
spricht. Besonders die Informationsextraktion, also die automatische Iden- 


° Vgl. Royal Netherlands Academy for Arts and Sciences. Humanities, Computers and Cultural 
Heritage. Proceedings of the XVI International Conference of the Association of History and 
Computing. 14-17 September 2005, Amsterdam. Adresse: http://www.knaw.nl/publicaties/pd£f/ 
20051064.pdf (letzte Einsichtnahme am 17.05.2006). 


1 Zu linearen String verarbeitenden Algorithmen: Maxime Crochemore und Wojciech Ritter: Je- 
wels of Stringology. New Jersey 2003. Darin besonders S. 183-198. 
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tifikation von Entitäten, kann mit Modulen erfolgen, die je nach Bedarf 
konfiguriert oder gar vom Betreiber selbst programmiert sein können. Die 
Dokumentenverarbeitung umfasst dabei üblicherweise Schritte wie die 
Feststellung des Encodings des zu verarbeitenden Dokuments, eine Kon- 
vertierung in Unicode/UTF-8, die Tokenisierung und, sofern gewünscht, 
eine Identifikation von weiteren Strukturmerkmalen wie Satzgrenzen oder 
Entitäten, wie sie durch lokale Grammatiken erkennbar sind. 

Im Rahmen der Pipeline wird auch festgestellt, ob eine Entität nicht im 
alphabetischen Standardindex, sondern im numerischen oder gegebenen- 
falls im zukünftig optionalen Geo-Index abgelegt werden soll. Die Typisie- 
rung der Entität erfolgt in jedem Fall während der Dokumentenverarbei- 
tung und damit außerhalb der eigentlichen Indexstruktur. Damit bleibt der 
Indexer selbst schlank und performant. 

Der Indexer unterscheidet zwischen den jeweiligen getypten Content- 
und den Strukturanteilen. Für Strukturanteile wird eine fortlaufende Num- 
mer vergeben, wobei diese bei einer fehlenden Strukturinformation, also 
bei flachen unstrukturierten Dokumenten, stets null ist. Das bedeutet, dass 
die Indexerarchitektur flache und damit nicht ausgezeichnete Dokumente 
ebenfalls verarbeiten kann. Sofern die Dokumentenverarbeitung ohne eine 
vorliegende Strukturinformation trotzdem andere Indextypen, also Zahlen 
oder geographische Informationen, erkennt, so wird die Indexerarchitektur 
sie problemlos indexieren. 

In Bezug auf die historisch-fachinformatische Aufgabenstellung kann 
darauf hingewiesen werden, dass jegliche anwendungsspezifischen Para- 
meter aus der Konfiguration der Dokumentenverarbeitung sowie der Ab- 
frageverarbeitung resultieren. Die Architektur des Indexers selbst ist gene- 
risch und flexibel genug, um vielen Bedürfnissen des modernen Informati- 
on Retrieval zu genügen. 

Es wurde beim Design der Indexarchitektur versucht, ein Optimum an 
Zugriffsgeschwindigkeit und Skalierbarkeit zu finden. Dies ist durch Ver- 
wendung der Methoden von Felix Weigel gelungen, der den ‚ContentAware 
DataGuide‘ entwickelt hat. Anders als in seiner Referenzimplementierung 
haben wir auf eine Datenbank verzichtet und verwenden für die Speiche- 
rung der Referenzen auf den Corpus reguläre Dateien und zur Verwaltung 
dieser die Mechanismen des Dateisystems. Auf diese Weise sparen wir 
Code zur Verwaltung der Referenzen und die Architektur gewinnt deutlich 
an Stabilität. Das Maximalmaß der Skalierbarkeit einer Implementierung 
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liegt bei den Grenzen der Partition, in welcher der Index gespeichert wird. 
Dabei kann es sich auch um ein logisches Volume handeln, das über meh- 
rere physikalische Volumes verteilt ist. Mit derartigen Verfahren liegt die 
theoretische maximale Skalierbarkeit des Indexers im unterenTerabyte-Be- 
reich. Tests stehen im Moment noch aus, sind jedoch bereits geplant. Als 
Testdaten sollen Genom-Sequenzierungsdaten dienen, die in den entspre- 
chenden Größenordnungen als XML-Dateien vorliegen. 

Alle Kernkomponenten des Indexers sind streng in C++ und die Einbin- 
dung von Modulen ist in Python gehalten. Die in Entwicklung befindliche 
Suchmaschine instantiiert daher nur verschiedenste Klassen einer Biblio- 
thek und führt sie in einer Applikation zusammen. Auf diesem Weg ist es 
möglich, die Klassen als Bibliothek gesondert abzulegen: unter Unix als 
‚Shared Object‘ und unter Windows als DLL. Die Entwicklungsplattform 
ist jedoch Linux/Unix. 

Von den großen, kommerziellen Vorbildern unterscheidet sich unser 
Projekt vor allem dadurch, dass Elemente fehlen, die für eine kommerzielle 
Infrastruktur typisch sind: Wir beabsichtigen, uns auf die Fragestellungen 
aus der Indexierung zu konzentrieren und überlassen die Implementierung 
von proaktiven Monitoringsystemen sowie von Ansätzen der verteilten 
bzw. clusterorientierten Architektur den Benutzern der Bibliothek, die der- 
artige Eigenschaften benötigen. 


4. Architekturdetails 


Das Projekt hat sich zum Ziel gesetzt, eine Indexierungsarchitektur zu entwi- 
ckeln, die Content-and-Structure(CAS)-Anfragen verarbeiten kann, wobei 
der Content-Anteil approximativ und getypt verarbeitet werden kann. Die 
Architektur soll modular, flexibel, skalierbar, robust und portierbar sein. Ein 
großer Teil der verwendeten und eingebundenen Technologien entstammen 
unserem Institut, die Architektur der Dokumentenverarbeitung ist an jene 
der Altavista- und der ‚FAST-DataSearch’-Engine angelehnt. 

Im klassischen XML-Retrieval wird jeweils der Strukturanteil einer Anfra- 
ge einerseits und der Contentanteil der Anfrage andererseits ausgewertet. 
Zur Laufzeit der Anfragebearbeitung wird ein Join der beiden Ergebnismen- 
gen berechnet, wobei die beiden Ergebnismengen erst vom Plattenspeicher 
in den Arbeitsspeicher geladen werden müssen. Felix Weigel, auf dessen An- 
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sätzen wir unsere Architektur maßgeblich begründen, kritisiert zurecht, dass 
beim Laden der Ergebnismengen unnötig viele ‚false positives‘ geladen wer- 
den müssen. Außerdem ist richtig, dass die Berechnung des Joins zur Lauf- 
zeit der Anfragebearbeitung die Ausgabe des Ergebnisses massiv und unnö- 
tig verzögert. Sein Konzept eines ‚Content-Aware DataGuide’‘ nimmt die Be- 
rechnung des Joins vorweg und bietet über einen Government- bzw. Con- 
tainment-Test die Möglichkeit, die Erfüllbarkeit der Anfrage zu prüfen, noch 
bevor von der Platte Locations geladen werden." 

Allerdings überlässt die Referenzimplementierung Felix Weigels die 
Speicherung der Daten über eine JDBC-Schnittstelle einer Datenbank. Wie 
oben bereits kurz ausgeführt, sehen wir in diesem Ansatz drei deutliche 
Nachteile: Falls eine JDBC-Implementierung verwendet wird, die auf ei- 
nem Netzwerk-Socket basiert, so wird die Zugriffsgeschwindigkeit durch 
die Abarbeitung der Netzwerkroutinen unnötig verzögert. Dies ist auch 
der Fall, wenn über das Loopback-Interface auf den Localhost zugegriffen 
wird. Hier entfällt natürlich die sonst zudem einzuberechnende Latenz bei 
Netzwerkverbindungen.'” Der zweite Nachteil liegt darin, dass die Mat- 
chingfunktionen der Datenbank überlassen bleiben. Eine Approximation 
über die Möglichkeiten des LIKE-Operators hinaus ist außerhalb des 
SOL92-Standards kaum denkbar, will man sich nicht an einen bestimmten 
Datenbankhersteller binden. Es ist zwar richtig, dass verschiedenste Daten- 
bankhersteller Operatoren entwickelt haben, deren Flexibilität weit jenseits 
derer des LIKE-Operators liegen. Aber die Modifikation der Matching- 
Engine einer Datenbank insgesamt erschien uns kaum kalkulierbar. Als 
dritten Nachteil sehen wir, dass die Verwendung der SOL-Schnittstelle ins- 
gesamt unnötig ist. Datenbanken sind generische Werkzeuge zur Speiche- 
rung von Daten. Auch wenn die Datenbanktechnologie sehr weit fortge- 
schritten ist und enorm leistungsfähige Verfahren zur Verwaltung von 
Daten hervorgebracht hat, so bindet einerseits die Formulierung, anderer- 
seits das Parsing und die Verarbeitung von SOL-Ausdrücken Prozessorzeit. 
Wir sind der Überzeugung, dass betriebssystemnähere und problemorien- 


" Felix Weigel, Holger Meuss, Francois Bry und Klaus Schulz: Content-Aware DataGuides: Inter- 
leaving IR and DB Indexing Techniques for Efficient Retrieval of Textual XML Data. In: Advances 
in information retrieval. Proceedings of the 26" European Conference on Information Retrieval 
(ECIR). Ed. by Sharon McDonald und andere. Berlin, Heidelberg 2004. S. 378-393. 


12 Adresse: http://java.sun.com/products/jdbc/ (letzte Einsichtnahme am 17.05.2006). Offizielle 
JDBC-Homepage der Firma SUN Microsystems. 
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tierte Ablagestrukturen gegenüber dem Einsatz von Datenbanktechnologi- 
en deutliche Geschwindigkeitsvorteile bieten. 

In der Implementierung der Ansätze aus dem CADG unter Verzicht auf 
eine relationale Datenbank und mit einer eigenen Verwaltung der Content- 
Tokens sehen wir die Möglichkeit, eine weitere Technologie aus dem Um- 
feld unseres Instituts zum Einsatz zu bringen: Stoyan Mihov und Klaus 
Schulz haben ein Verfahren vorgestellt, mit dem in einem Wörterbuch-Au- 
tomaten sehr schnell approximativ gesucht werden kann.” 

Die Flexibilität der Architektur wird dadurch sichergestellt, dass der 
größte Teil der Vorverarbeitung der Dokumente durch Module erfolgt, die 
der Betreiber der Infrastruktur nach seinen Bedürfnissen konfigurieren 
kann. Die Schnittstelle zu den Modulen ist genauso wie bei ‚FAST Data- 
Search’ in der Scriptsprache Python gehalten. 

Die Relevanzsortierung ist ein Thema, das sich wie natürlich an die Fra- 
gestellung der Indexarchitektur anschließt. So verwundert es nicht, dass 
sich der Autor des ‚Content-Aware DataGuide‘, Felix Weigel, ebenfalls mit 
dieser Frage befasst hat.“ Der Inhalt seiner Überlegungen betrifft die Frage, 
wie verschiedene Rankingmodelle mit dem Verfahren des vorberechneten 
Joins zwischen Struktur- und Contentinformation integriert werden kön- 
nen. Seine Betrachtungen beziehen sich dabei auf XPRES”, BUS", XIRQL” 
und XXL". 


! Stoyan Mihov und Klaus Schulz: Fast Approximate Search in Large Dictionaries. In: Computa- 
tional Linguistics 30 (2004). S. 451-477. 


"* Felix Weigel, Holger Meuss, Klaus Schulz und Francois Bry: Content and Structure in Indexing 
and Ranking XML. In: Proceedings of the 7th International Workshop on the Web and Data- 
bases (WebDB 2004). 17-18 June 2004, Paris, France. Ed. by Sihem Amer-Yahia und Luis Gravano. 
0.0.0. J. S. 67-72.. 


"5 Jens E. Wolff, Holger Flörke und Armin B. Cremers: Searching and Browsing Collections of 
Structural Information. In: Proceedings of the IEEE Forum on Research and Technology Ad- 
vances in Digital Libraries. Washington 2000. S. 141-150. 

1€ Dongwook Shin, Hyuncheol Jang und Honglan Jin: BUS. An Effective Indexing and Retrieval 
Scheme in Structured Documents. In: Proceedings of the 3rd International Conference on Digital 
Libraries. Pittsburgh 1998. S. 235-243. 

7 Norbert Fuhr und Kai Großjohann: XIRQL: A Query Language for IR in XML Documents. In: 
Proceedings of the 24th Annual International Conference on Research and development in In- 
formation Retrieval. ACM. New York 2001. S. 172-180. 

18 Anja Theobald und Gerhard Weikum: The Index-based XXL Search Engine for Querying XML 
Data with Relevance Ranking. In: Proceedings of the 8th International Conference on Extending 
DB Technology. Prag 2002. S. 477-495. 
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Die atomare Einheit in unserem Index und damit das Objekt, das der Be- 
nutzer zu finden gedenkt, ist ein spezifischer Token in einem spezifischen 
Container. Eigentlich soll in der Regel eine Location gefunden werden, also 
eine Stelle in einem Text. In Bezug auf semistrukturierte Dokumente kann 
jedoch nicht mehr von der semantischen Homogenität eines Dokuments 
ausgegangen werden, und so nimmt der XML-Container mit einem be- 
stimmten Pfad die Stelle ein, die in der Bewertung flacher Corpora das Do- 
kument hat. Es soll also nach einer Stelle in einem bestimmten Container 
gesucht werden. Da die Stelle jedoch aus einer Kombination von Doku- 
ment und XML-Pfad besteht, muss jede Stelle eine Nummer enthalten, da- 
mit nicht nur zwischen den Dokumenten im Corpus, sondern zwischen al- 
len Containern unterschieden werden kann. 

Die Anfrage sucht stets nach den Containern, in denen ein bestimmter 
Content eine herausragende, bezeichnende Bedeutung hat. Insofern muss 
beim Befüllen des Index und beim Erstellen der Rankingparameter bedacht 
werden, ob ein bestimmter Token in einem bestimmten Container relevant 
ist. Dies kann durch die Berechnung der ‚Term Frequency‘ erfolgen. Auf 
diese Weise ist es möglich, je Dokument die Reihenfolge der relevantesten 
Wörter festzulegen. 

Allerdings kann erst dann eine wirksame Aussage über die Relevanz ei- 
nes Wortes in Bezug auf den Text getroffen werden, wenn die Termfre- 
quenz zur Häufigkeit des Wortes im Corpus in Bezug gesetzt wird. Diese 
Bezugsetzung erfolgt rechnerisch über eine Invertierung, der ‚Inverse Do- 
cument Frequency. 

In Bezug auf semistrukturierte Dokumente muss daher die Relevanz im- 
mer in Bezug auf denselben Containertyp ermittelt werden, da es sich bei 
einem semistrukturierten Corpus genau genommen nicht um einen homo- 
genen Pool an Texten handelt, sondern um eine Menge sehr spezifisch aus- 
gezeichneter Texte, die in den jeweiligen Containern enthalten sind. Aus 
diesem Grund modifizieren wir die Formel ‚TF/IDF’ zu ‚TF/ICF’ (Inverse 
Container Frequency). 

Der Wert, der sich aus der Berechnung von TF und ICF ergibt, ist das 
Sortierungskriterium der Location-Liste in den LL-Dateien. Er wird zusam- 
men mit den Location-IDs abgespeichert, um eine Einfügung an einer ent- 
sprechenden Stelle zu erlauben, wenn weitere Daten im Index abgelegt 
werden. 
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Für die Berechnung von TF/ICF es ist nötig, die Containerfrequenz des 
jeweiligen Wortes zu kennen. Daher steht sie an der ersten Stelle der Loca- 
tion-Liste. Beim Einfügen eines neuen Eintrags muss die Location-Liste 
ohnehin geladen werden, und so kann ohne großen gesonderten Aufwand 
die Information über die ICF des jeweiligen Wortes gleich in den Speicher 
geladen und zur Verarbeitung bereitgestellt werden. 

In Bezug auf die von Felix Weigel betrachteten Rankingverfahren lehnt 
sich unser Verfahren an BUS an. Allerdings trennen wir klar zwischen der 
Relevanzfeststellung des Contentanteils und des Strukturanteils, da letzte- 
res in unserer Gesamtarchitektur eine besondere Rolle spielt: Die Bewer- 
tung des Strukturanteils fließt zum Zeitpunkt der Befüllung noch nicht mit 
ein, sondern über ihn bilden wir die Präferenzen der verschiedenen Benut- 
zergruppen ab. Doch dazu später mehr im Abschnitt über das Ranking. 

Die Komponenten der Architektur sind in einzelnen: 


- der Feeder, welcher folgende Komponenten enthält: 
— den Parser, 
- die Document Processing Pipeline, 
— der Indexer (apCADG), welcher folgende Komponenten enthält: 
den DataGuide, 
— den WordIndex, 
— den NumericIndex, 
— als Option den Geo-Index, 
— das Lametta, 
- die StorageArea auf der Platte, 
—- den QueryProcessor, 
- der QueryHandler, der folgende Komponenten enthält: 
- die Query Processing Pipeline, 
- den Kontrollautomaten-Compiler, 
— den Ranker. 


Die wichtigsten der genannten Komponenten sollten folgend kurz vorge- 
stellt werden: 


4.1 Der Feeder 


Der Feeder ist eine Wrapper-Klasse, die das einzulesende Dokument entge- 
gennimmt und dem SAX-Parser übergibt. Dieser zerlegt es in Pfad-Con- 
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tent-Tupel und übergibt jeden der Tupel an die Document Processing 
Pipeline. Diese implementiert eine in den C++-Code eingebettete Python- 
Instanz, wobei die Tupel an die Python-Instanz zur Verarbeitung überge- 
ben werden. Die Instanz lädt je nach Konfiguration ein Framework an 
Python-Modulen, deren wichtigste Aufgaben folgende sind: 


- Encoding-Normalisierung auf UTF-8, 
— Tokenisierung, 
— Annotation von Entitäten. 


Es sind zahlreiche weitere Bearbeitungsstufen denkbar wie eine Language- 
Detection, ein Lemmatizer, ein Vectorizer, eine Date/Time-Extraction und 
viele mehr. Wir beschränken uns auf letztere, da sie wirklich essentiell sind. 
Die Abwendung von der Entität der XML-Datei als solcher ist dadurch ge- 
rechtfertigt, dass einerseits eine XML-Datei mehrere Quellentexte enthalten 
kann, und der Benutzer andererseits nicht daran interessiert ist, Dateien, 
sondern Dokumente, respektive Textstellen, im Corpus zu finden. 


4.2 Der DataGuide 


Man kann ein XML-Dokument als Baum darstellen, bei dem der äußerste 
XML-Knoten der Wurzelknoten und jeder innere Container ein entspre- 
chender Kind-Knoten ist.” Wenn man die Wurzelknoten aller Dokumente 
im Corpus zusammenfasst, und dabei alle namensgleichen Container kon- 
solidiert, so erhält man einen Baum an all den XML-Pfaden, die im Corpus 
enthalten sind. Ein Baum dieses Typs wird DataGuide genannt. Jeder Kno- 
ten dieses Baumes erhält dabei eine ganzzahlige, fortlaufende Nummer, 
ungeachtet dessen, ob es sich dabei um einen Knoten des Schema-Typs PC- 
DATA (Knoten ohne weitere Kinder) handelt oder nicht. 

Unsere Implementierung verwendet eine modifizierte Fassung der 
‚core::tree‘-Template-Klasse von Justin Gottschlich”, die insofern verändert 
wurde, als dass die Suche eines bestimmten Kindknotens im Baum nicht 
mehr linear, sondern mit einer STL-Map logarithmisch erfolgt. Wir haben 


® Zur Baumdarstellung von XML-Dokumenten siehe: Jamens Clark und Steven deRose: XML Path 
Language (XPath) 1.0. W3C Recommendation 16 November 1999. Adresse: http://www.w3c.org/ 
TR/xpath (letzte Einsichtnahme am 17.05.2006). 


2 Vgl. Justin Gottschlich: C+ Trees. Adresse: http://www.gamedev.net/reference/programing/ 
features/coretreel/ (letzte Einsichtnahme am 17.05.2006). 
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das C++-Template so verändert, dass jeder Elternknoten seine Kindknoten 
anhand eines eineindeutigen Namens identifiziert. Der Name ist dabei der 
Tag des entsprechenden XML-Containers. 

Besondere Beachtung verdienen Attribute, denn sie kommen unter Um- 
ständen mehrfach in demselben XML-Tag vor. Wir behandeln Attribute wie 
Pfaderweiterungen, wobei der Inhalt des Containers bei mehreren Attribu- 
ten mehrfach indexiert wird. Zudem wird die Gesamtheit aller Attribute 
zusammengefasst und Container auf diese Weise anhand ihrer gesamten 
Strukturidentifikation auffindbar gemacht. 


4.3 Der WordIndex und Kompilierungsverfahren 


Der Zugriff auf den Wortindex implementiert ein Verfahren nach Klaus 
Schulz und Stoyan Mihov,” nach dem mittels Backtracking in einem Wort- 
index einerseits und einem Levenshtein-Kontrollautomaten andererseits 
bei kurzen Wörtern und einer niedrigen Editierdistanz drastische Ge- 
schwindigkeitsgewinne erreicht werden können. Das Verfahren setzt also 
einen bereits fertig kompilierten Wortindex voraus, dessen Kompilierung 
folgend kurz beschrieben werden soll. 

In seiner logischen Darstellung besteht der Index aus einem klassischen 
Trie.? Von einer Wurzel ausgehend führen deterministische Übergänge zu 
neuen Zuständen, wobei bei jeder tieferen Übergangsstufe der Präfix des 
eingegebenen Wortes weiter spezifiziert wird. Mathematisch wird eine der- 
artige Struktur als ein deterministischer, endlicher azyklischer (gerichteter) 
Graph bezeichnet. 

Würde man nun jeden Zustand des Graphen im Speicher eigens allo- 
kieren, so bräuchte man ohne Rücksicht auf die im jeweiligen Zustand real 
existierende Anzahl an Übergängen eine linear große Speichermenge. Da 
jedoch die Anzahl der Wörter eine der stark skalierenden Größen im Index 
ist, wird man bestrebt sein, gerade hier den Speicherverbrauch einzudäm- 
men. Aus diesem Grund liegt es nahe, eine Kompression der Übergangs- 
tabelle nach einem Verfahren von Tarjan vorzunehmen.” Dieses Verfahren 


>! Vgl. Anm. 13. 
? Zu Tries siehe: Donald E. Knuth: The Art of Computer Programming. Vol. 3, 2nd ed. Boston 
1998. S. 492-512. 


2 Robert Endre Tarjan und Andrew Chi-Chih Yao: Storing a sparse table. In: Communications of 
the ACM 22 (1979). S. 606-611. 
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verschränkt Übergänge in einer Weise, in der die Performanz im Zugriff 
auf die Zustände nicht beeinträchtigt wird, wobei aber durch die Ver- 
schränkung enorm an Platz gespart wird. 

In unserem Ansatz verwenden wir das Tarjan-Verfahren, jedoch erweitern 
wir es zu einem Iransduktor, der nicht nur Eingabewörter erkennt, sondern 
bei einem Endzustand einen Ausgabewert zurückgibt. Der Ausga-bewert in 
unserem WordIndex besteht aus einer Sprungadresse im Speicher und einer 
fortlaufenden Zahl. Die Sprungadresse zeigt auf den entsprechenden Bit- 
string in der Lametta-Datenstruktur. Die fortlaufende Zahl wird für die 
Adressierung der jeweiligen Location-Datei auf der Platte benötigt. 

Der Kompilierungslauf ist in diesem Sinne eigentlich ein Kompressions- 
lauf, der den Stack und die Liste der bereits verarbeiten Wörter zusammen- 
führt und sortiert und anschließend daraus den Trie in seiner kompakten 
Form berechnet und im Speicher zur Verfügung stellt. Dieselben Verfahren 
kommen bei der Kompilierung der Lamettatabelle zum Einsatz. 

Der Tarjan-Mechanismus allokiert also je Zeile der Übergangstabelle 
entsprechend der Länge des Alphabets in einem vordefinierten und mit 
Null-Pointern initialisierten Speicherbereich 2n+1 Zellen, wobei n die 
Mächtigkeit des Alphabets ist. Eine Zelle beinhaltet zwei Zeiger, wobei der 
eine auf den nächsten Zustand und der andere auf den Anfang des aktuel- 
len Zustands zeigt, um sicherzustellen, dass der aktuelle Übergang auch 
ein Übergang des aktuellen Zustands ist. In Erweiterung zum Tarjan-Sche- 
ma fügen wir dem Algorithmus noch einen weiteren Zeiger hinzu: Am An- 
fang der Tarjan-Zeile befindet sich in unserer Implementierung ein Zeiger 
auf den Anfang des vorhergehenden Zustands, welcher benötigt wird, um 
mit einer möglichst geringen Speichersignatur eine Rückwärts-Auflösung 
des Tokens zu ermöglichen. 


4.4 Der Numericindex 


Der Index zur numerischen Approximation bewegt sich lediglich in einer 
einzigen, zeitlichen Dimension. Eine Approximation erfolgt daher aus- 
schließlich numerisch. Die am besten geeignete Datenstruktur hierfür ist 
eine Double Ended Queue: Eine zweifach verlinkte Kette der CH Standard 
Template Library, die einen Zugriff über einen Index erlaubt, aber auch 
Einfüge-Operationen zur Verfügung stellt. Jedes Glied der Kette ist dabei 
vergleichbar mit einem Endzustand und beinhaltet daher einen Zeiger auf 


Fachspezifische Indexierung von historischen Dokumenten II 77 


die entsprechende Lametta-Zeile sowie eine Zahl als Indexmerkmal für die 
Datenstruktur auf der Platte. Diese Zahlen sind über alle Index-Systeme 
hinweg fortlaufend. 

Zum gegenwärtigen Stand sehen wir den Einsatz eines Konstrukts aus 
der STL als den effektivsten Weg, zu einer funktionierenden Architektur zu 
gelangen, und wollen daher nicht ausschließen, dass hier noch Optimie- 
rungspotential besteht. 


4.5 Das Lametta 


Das Lametta hat die folgende Funktion: Die Nummer des XML-Knotens, 
die der DataGuide bei der Queryverarbeitung liefert, dient als Index für ei- 
ne Bitfolge, bei der jeweils das erste Bit den ‚Containment-Test‘, und das je- 
weils zweite Bit den ‚Government-Iest‘ ermöglicht. Der Containment-Test 
beantwortet die Frage, ob ein XML-Knoten selbst das gesuchte Wort ent- 
hält. Der Government-Test beantwortet die Frage, ob eines der Kinder des 
aktuell betrachteten Knotens das Wort enthält. Der Containment-Test gibt 
die qualifizierte Antwort, ob es gerechtfertigt ist, mit der Nummer des Da- 
taGuide-Knotens und der Nummer des Worts aus dem Wortindex auf der 
Platte aus der ‚Ablagestruktur nach Contentinformation’ die Liste der zu- 
treffenden Locations zu holen. 

Der Government-TIest ist besonders bei Anfragen wichtig, bei denen sich 
in der Pfadinformation ein Freiheitsgrad im Sinne eines Kleene-Sternchens 
befindet. Hier muss der Pfadbaum in der Tiefe durchlaufen werden, um 
nicht Pfade zu selektieren, bei denen das gesuchte Wort ohnehin nicht ent- 
halten ist. Wir verwenden den binären Government-Test um zu klären, ob 
sich ein Hinabsteigen in einen bestimmten Pfad überhaupt lohnt. Die kon- 
zeptionelle Idee hierfür entstammt den Arbeiten von Felix Weigel. 

Unsere Implementierung ohne Rückgriff auf eine Datenbank arbeitet 
mit festen Bitstring-Längen, wobei im Gegensatz zur Kompilierung von 
Automaten keine Übergänge, sondern lediglich eine Bool’sche Wahr- oder 
Falsch-Information kodiert werden soll. Beide Informationen werden durch 
Gerichtetheit des Speicherwertes auf den Anfang oder das Ende der festen 
Zeilenlänge der Tabelle kodiert. Auf diese Weise lässt sich eine ebenso leis- 
tungsfähige, Speicher sparende Kompression wie bei der Kompilierung des 
Wordindex erreichen. 
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Sollte bei einer Neukompilierung die feste Länge des Bitstrings nicht 
ausreichen, so wird diese um einen festen Wert erweitert. Dieses Verfahren 
belegt angesichts der Tarjan-Kompressionsmethode keinen unnötigen Spei- 
cherplatz, da unbenutzte Speicherzellen weiterhin von anderen passenden 
Bitstrings benutzt werden können. 

Die Abarbeitung der beiden Tests erfolgt, indem aus dem WordIndex 
auf den Speicherplatz des entsprechenden Lametta-Strings gesprungen 
wird. Mit der Indexzahl aus dem DataGuide wird die Position der jeweili- 
gen Speicherzelle ermittelt. Wenn der Zeiger in dieser Zelle mit dem Zeiger 
auf die Lamettafolge, also die erste Speicherzelle der Zeile, identisch ist, so 
ist der Test positiv. Zeigt der Zeiger in der Speicherzelle auf das Ende der 
Lamettafolge, so ist der Test negativ. Nicht beschriebene Zellen enthalten 
den Null-Wert. 


4.6 Die StorageArea 


Zur Ablage der Locations auf der Festplatte haben wir folgende Systematik 
erarbeitet: Um den Durchgriff auf die Daten bei der Suche möglichst ro- 
bust, schnell, skalier- und portierbar zu halten, haben wir uns an den Mög- 
lichkeiten orientiert, die gängige Betriebssysteme zur Verfügung stellen. 
Die Ansprache einer Locations-Datei erfolgt daher über einen Dateipfad, 
der nach der Abarbeitung der im Speicher befindlichen Datenstrukturen zu- 
sammengestellt wurde. Die fortlaufenden Nummern aus dem DataGuide 
und den Indexstrukturen werden in ihre hexadezimale Repräsentation kon- 
vertiert und in jeweils zwei Zeichen gestückelt. Anschließend wird eine Datei 
mit dem Namen „LL“ hinzugefügt, sodass ein Pfad wie folgt aussieht: 

Aus einer DataGuide-Nummer „3f4d“ und einer Wordindex-Nummer 
„19bc3d“ wird nun der Pfad „<Stamm>/3f/4d/19/bce/3d/LL“. „LL“ ist dabei 
eine Datei, die die Liste aller Locations enthält. Der Dateiname wurde aus 
dem Grund auf „LL“, bzw. auf „ZZ“ gesetzt, weil diese Buchstaben nicht 
Teil des hexadezimalen Alphabets sind. 

Bei einer hexadezimal dreistelligen Wortadressierung liegt die maximale 
Skalierung bei 16 777 216 möglichen Wörtern. Falls diese Anzahl übertrof- 
fen wird, so wird der bestehende Baum in ein neu zu schaffendes Unter- 
verzeichnis „<Stamm>/00“ kopiert und im neu anzulegenden Verzeichnis 
„<Stamm>/01” fortgesetzt. Um eine entsprechende Skalierung zu gewähr- 
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leisten, ist es also angebracht, von vornherein einen ausreichend großen 
Adressraum zur Verfügung zu stellen. 

Die Aufteilung des Pfades in jeweils zwei Stellen erfolgt aus dem Grund, 
dass viele Dateisysteme nicht in der Lage sind, größere Mengen an Dateien 
in einem Verzeichnis in logarithmischer Zeit zu verwalten. Ein einfaches 
„ls“ in einem ext2-Dateisystem und 100 000 Dateien in einem Verzeichnis 
führt zu einer beachtlichen Wartezeit. Mit Blick auf die geforderte Portier- 
barkeit muss von anderen, noch deutlich weniger leistungsfähigen Datei- 
systemen wie FAT32 ausgegangen werden. So befinden sich in jedem Ver- 
zeichnis lediglich maximal 256 Unterverzeichnisse — eine Zahl, die jedes 
Dateisystem mit ausreichender Performanz verwalten kann. 

Die Ordnung nach Pfad-Wort ist aus dem Grund so gewählt, weil es 
XML-Tags gibt, die keinen Content enthalten. Sie haben keinen schließen- 
den Tag und stehen für sich. In diesem Fall ist der Pfad zur „LL“-Datei: 
“<Stamm>/3f/4d/00/00/00/LL”. Mit einer Anordnung, in welcher der Pfad 
zu einer Pfadnummer, der mangelnde Content aber nur zu einer „0“ führt, 
sind derartige Pfadelemente ohne Probleme abbildbar. 

Die eingangs geforderte Eigenschaft, dynamische ‚Drilldowns’ anzubie- 
ten, wird mit folgendem Mechanismus unterstützt: Ein Drilldown besagt, 
dass in der Ergebnismenge eines Suchworts alle erkannten Entitäten dyna- 
misch und in Abhängigkeit vom Suchwort ausgegeben werden sollen. 
Wenn beispielsweise nach „HSV“* gesucht wird, sollen alle Namen der 
Fußballspieler ausgegeben werden, die ebenfalls, und zwar ausschließlich, 
in den Dokumenten vorkommen, in welchen der gesuchte String (hier 
„HSV”) vorkommt. In Bezug auf semistrukturierte Dokumente bedeutet 
das, dass der Spielername in der Dokumentenverarbeitung gesondert als 
solcher ausgezeichnet wird und die Wortindex-Nummer aller Spieler- 
namen in demselben Verzeichnis, in welchem sich die „LL“-Datei befindet, 
in einer „ZZ”-Datei verzeichnet wird. Entsprechend der Häufigkeit kann 
hier bereits eine erste Sortierung vorgenommen werden. 

Übertragen auf die historische Fragestellung und unter der Vorausset- 
zung, dass eine Eigennamenerkennung in der Dokumentenverarbeitung 
zuverlässige Ergebnisse liefert, kann damit etwa die Frage beantwortet 
werden, welche Personen in einem bestimmten historischen Kontext auf- 
tauchen. Falls man eine Ortsnamenerkennung implementiert, kann in Be- 
zug auf einen bestimmten historischen Vorgang ein Profil aller Orte erstellt 


% Hamburger Sportverein. 
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werden, zu denen der Vorgang in Bezug steht. Ein Drilldown würde nun in 
der ersten Ergebnisdarstellung die erkannten Entitäten in Bezug auf ein 
Suchwort ausgeben. 

Der Benutzer würde in einem nächsten Schritt den ausgewählten Begriff 
zusammen mit dem ursprünglichen Suchwort als erneute Suche abschi- 
cken. Ab hier handelt es sich um Suchvorgänge mit mehreren Constraints, 
sodass Joins unvermeidlich sind. Die Bearbeitung von Joins von Ergebnis- 
mengen ist jedoch ein weiterführendes Thema und soll an dieser Stelle ex- 
plizit als offener Punkt vermerkt werden. In dieselbe Problematik fällt auch 
die der Verarbeitung von Seitenbedingungen, die in XPath spezifiziert sind. 

Wichtig in Bezug auf die Erfassung von Drilldowns im Index ist, dass 
die Auszeichnung einer Entität außerhalb des Index erfolgt. Der Index 
selbst kann ohne eine erforderliche Neukonfiguration und ein erneutes 
Einlesen des gesamten Corpus ohne Unterbrechung weiter betrieben wer- 
den. Die Auszeichnung erfolgt in einem Modul in der Dokumentenverar- 
beitung und kann beliebig vom Benutzer konfiguriert werden. 


4.7 Der QueryProcessor 


Der QueryProcessor übernimmt vom QueryHandler, der Steuerkomponen- 
te der Query-Verarbeitung, eine Strukturinformation und ein Eingabewort 
in Form eines standardkonformen XPath-Ausdrucks” sowie einen auf dem 
Eingabewort fertig kompilierten Kontrollautomaten, der implizit die maxi- 
mal erlaubte Approximationsdistanz bereits enthält. Seine Aufgabe ist, die 
Anfrage auf der Basis der zuvor vorgestellten Datenstrukturen abzuarbei- 
ten und eine Liste an treffenden Locations zurückzugeben, wobei jede Lo- 
cation mit dem Multiplikator der approximativen Distanz, aber auch den 
TF/ICF-Werten annotiert wird. Die Auswertung der für das Ranking rele- 
vanten Informationen erfolgt durch den Ranker. 

Nach der Übernahme des XPath-Ausdrucks wird dieser in seinen Con- 
tent- und seinen Strukturanteil aufgetrennt. Zudem wird ermittelt, ob der 
Strukturanteil Freiheitsgrade enthält oder nicht. 

Der mit übergebene Automat dient als Kontrollsystem bei der Bearbei- 
tung des WordIndex, wobei in beiden Strukturen parallel in der Tiefe fort- 
geschritten wird. Falls ein Zeichen aus dem Eingabewort nicht weiter im 


3 Der XPath-Standard. Adresse: http:;//www.w3c.org/TR/xpath (letzte Einsichtnahme am 
17.05.2006). 
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WordIndex vorhanden ist, wird anhand des Kontrollautomaten festgestellt, 
ob die bisher vorgenommenen Abweichungen noch innerhalb der maximal 
zulässigen Editierdistanz liegen. Wenn dies der Fall ist, kann im WordIn- 
dex nach einem alternativen Übergang gesucht und dieser Weg weiter ver- 
folgt werden. Ein Treffer ist dann gefunden, wenn sowohl im Kontrollauto- 
maten als auch im WordIndex ein Endzustand erreicht wird. Allerdings en- 
det die Suche in diesem Fall nicht nach dem Finden eines ersten Treffers, 
sondern mittels Backtracking wird versucht, den gesamten Suchraum in- 
nerhalb der definierten Fehlertoleranz auszuschöpfen. 

Da ein Treffer im WordIndex zu einem Lametta-Bitstring führt, ist nun 
auch eine Abarbeitung der Überprüfung des Strukturanteils möglich. Falls 
der Strukturanteil keine Freiheitsgrade aufweist, so kann direkt mit einem 
Containment-Test ermittelt werden, ob die Anfrage erfüllbar ist. Falls Frei- 
heitsgrade vorhanden sind, so wird anhand des Government-Tests im La- 
metta-Bitstring untersucht, wie weit in den Dataguide-Baum hinabgestie- 
gen werden kann. Ein positiver Government-Test besagt, dass Kinder des 
aktuell betrachteten Knotens im Corpus das besagte Suchwort enthalten. 
Bei jedem Kind wird dann wiederum ein Containment-Test vorgenommen, 
um Knoten zu identifizieren, in denen im Corpus das zuvor identifizierte 
Wort auch wirklich vorkommt. 

Führen Government- sowie Containment-Tests anhand des Lametta-Bit- 
strings schließlich zu Knoten, mit denen die Anfrage erfüllbar ist, so wird 
aus den von den beiden Datenstrukturen erhaltenen Nummern der Pfad 
zur Locations-Datei zusammengestellt. Die Locations werden zusammen 
mit der erreichten Editierdistanz und mit den einzeln verfügbaren TF/ICF- 
Werten an den Ranker gegeben. 


4.8 Die Query Processing Pipeline 


Grundsätzlich ist jede Indexierung ein symmetrisches Verfahren: Damit die 
Dokumente in einem Corpus gefunden werden können, müssen die Texte 
in die Einheiten zerlegt werden, die später gefunden werden wollen. Also 
enthält ein Index atomare Informationsentitäten, die aus den zu indexie- 
renden Dateien oder Dokumenten herausgearbeitet werden müssen. Die 
Symmetrie besteht insofern, als auch die Anfrage an eine Suchmaschine 
einer Verarbeitung unterworfen sein muss: Die Anfrage muss so weit auf- 
bereitet werden, dass sie den indexierten Entitäten exakt entspricht. Archi- 


82 Markus Heller 


tektonisch ergeben sich daher zwei Verarbeitungspipelines, eine so genann- 
te ‚Document Processing Pipeline‘ sowie eine ‚Query Processing Pipeline‘. 

Der Unterschied zwischen beiden Zugriffsmethoden auf den Index be- 
steht darin, dass die Query Processing Pipeline die Verarbeitung in Echtzeit 
vornehmen muss, und die gefundenen Ergebnisse noch einer Nachbear- 
beitung unterworfen werden müssen. In letzterer muss noch eine Gewich- 
tung und die Auswertung der Rankingparameter errechnet werden. Weil 
die Document Processing Pipeline keinen zeitkritischen Einschränkungen 
unterworfen ist, da die Dokumentenverarbeitung vorab erfolgt, hängt eine 
gute Antwortzeit direkt von der Verarbeitungsgeschwindigkeit der Query 
Processing Pipeline ab. Im Gegensatz zur Dokumentenverarbeitung findet 
man in Installationen kommerzieller Suchmaschinen bei der Anfrageverar- 
beitung selten Module in Skriptsprachen. Allerdings sind die Aufgaben 
auch meist deutlich weniger komplex. 

Die Query-Verarbeitung hat die Aufgabe, aus dem eingegebenen String 
und der in der GUI ausgewählten Strukturinformation alle nötigen Infor- 
mationen zu extrahieren und diese dergestalt aufzubereiten, dass sie an 
den Index übergeben werden können. Komponenten einer typischen 
Query Processing Pipeline sind: 


— Encoding-Feststellung, 

- Normalisierung auf UTF-8, 

— Erkennung der eingegebenen Sprache, 
— Tokenisierung, 

— Lemmatisierung. 


Da die Entwicklung derartiger Module einen nicht zu unterschätzenden 
Mehraufwand darstellt, soll im Rahmen dieses Projekts lediglich ein Toke- 
nisierungsmodul entwickelt werden. In Bezug auf die übrigen Arbeits- 
schritte ist die Entwicklung der entsprechenden Module an den Bedarf aus 
dem zukünftigen Einsatz gebunden. Da während der Entwicklungsphase 
des vorliegenden Projekts von einer kontrollierbaren Datenlandschaft und 
sauberen Beispieldaten ausgegangen werden kann und ein entsprechender 
Bearbeitungsbedarf nicht besteht, werden die Module von passiven Proto- 
typen ersetzt, die später gegen funktionale Komponenten ausgetauscht 
werden können. 
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Das Ergebnis der Anfragebearbeitung ist in jedem Fall ein standardkonfor- 
mer XPath-Ausdruck sowie ein kompilierter Kontrollautomat, der die In- 
formation enthält, ob und in welchem Rahmen eine approximative Suche 
vorgenommen werden muss. Sollte der Eingabestring der Anfrage aus 
mehreren Wörtern bestehen, so werden im Query-Iokenizer mehrere 
XPath-Anfragen mit gegebenenfalls mehreren Automaten generiert. Die 
Schnittstelle zum Index ist explizit konform zum XPath-Standard, um auch 
maschinelle Anfragen aus anderer Quelle abarbeiten zu können. 


4.9 Der Kontrollautomaten-Compiler 


Je nach Anforderung und Approximationsbedarf wird nach dem Verfahren 
von Mihov und Schulz auf jedes Eingabewort ein Automat kompiliert, der 
gemäß der Definition der Levenshtein-Editieroperationen” (Einfügungen, 
Löschungen, Ersetzungen) die Kontrolle von Abweichungen innerhalb be- 
stimmter Distanzgrenzen erlaubt.” 

Der Kompilierungsvorgang verläuft jedoch nicht rein algorithmisch, son- 
dern es werden äquivalente Übergänge einkompiliert, sodass etwa Phäno- 
mene wie die Äquivalenz von „u“ und „v“ im Anlaut ohne Feststellung 
eines Fehlers behandelt werden können. Es können so aus der diachronen 
Linguistik bekannte graphemische (Allographe) oder phonetische Phäno- 
mene abgebildet und entsprechend behandelt werden.” Ziel hierbei ist die 
mit Blick auf die Eigenschaften der alten Texte erforderliche Erweiterung 
des Recall. 


4.10 Der Ranker 


Wie oben beschrieben, trennen wir zwischen der Bewertung der Contentre- 
levanz und der Bewertung der Strukturrelevanz: Beinhaltet die Strukturin- 
formation keine Freiheitsgrade, so ist eine Gewichtung der Strukturinfor- 


% Vladimir I. Levenshtein: Binary codes capable of correcting deletions, insertions, and reversals. 
In: Doklady Akademii Nauk SSSR 163 (1965). S. 845-848 (Russisch). Englische Ubersetzung in: 
Soviet Physics Doklady 10 (1966). S. 707-710. 


” Vgl. Kemal Oflazer: Error-tolerant finite-state recognition with applications to morphological 
analysis and spelling correction. In: Computational Linguistics 22/1 (1996). S. 73-89. 


28 Zu den diachronen Varianzen zum und vom Frühneuhochdeutschen in spätere Sprachstände: 
Gerhard Philipp: Einführung ins Frühneuhochdeutsche. Sprachgeschichte, Grammatik, Texte. 
Heidelberg 1980. 
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mation überflüssig, da der Benutzer dem System keinen Entscheidungs- 
spielraum lässt. Beinhaltet die Strukturinformation doch Freiheitsgrade, so 
erfolgt in unserer Architektur eine benutzerbezogene Relevanzgewichtung: 
Unter der Annahme, dass es sich um eine zweckgebundene Suchmaschine 
für eine bestimmte Benutzergruppe und für eine bestimmte Sorte an Doku- 
menten handelt, sehen wir die Möglichkeit der Gewichtsmultiplikation 
durch den Ranker vor. Hier genügen wir der Forderung, dass verschiedene 
Nutzergruppen einer Suchmaschine für historische Daten unterschiedliche 
Interessenschwerpunkte haben können. Indem abhängig vom Benutzerpro- 
fil eine besondere Ergebnisgewichtung vorgenommen werden kann, lässt 
sich die Ergebnismenge so sortieren, dass beispielsweise eher Treffer aus 
dem Originaltext oder eher Treffer aus dem Kommentar oder eher Treffer 
aus den Metadaten angezeigt werden. 

In die Errechnung der Sortierung der Locations fließen damit die Edi- 
tierdistanz aus der Abarbeitung des Automaten, der TF/ICF-Wert sowie die 
benutzerorientierte Gewichtung der Strukturinformation ein. 


5. Projektstand 
Zum Zeitpunkt der Kalenderwoche 16/2006 sind der Feeder samt XML-Par- 


ser, die Architektur der DocumentProcessing Pipeline, der DataGuide und 
erste Teile des WordIndex fertig gestellt. 


Digitale Erschließung und Sicherung 
von aktuellen archäologischen Befunden 


Christoph Schäfer 


1. Forschungsdiskussion im Niemandsland 


Vehement vorgebracht und erbittert ausgetragen haben erst jüngst wieder 
einige Forschungskontroversen aus den Altertumswissenschaften nicht al- 
lein die Fachwelt, sondern gerade auch die Öffentlichkeit erschüttert. Als 
Beispiele sei nur der ‚neue Streit um Troja’ angeführt, in dem die Prot ago- 
nisten, bezeichnenderweise beide Professoren an der Universität Tübingen, 
sich alsbald auf einer wenig sachlichen Ebene äußerten." 

Kaum weniger aufgeladen ist die Diskussion um die Varusschlacht. Ins- 
besondere bezüglich der Befunde des frühkaiserzeitlichen Schlachtfelds 
von Kalkriese schlagen die Wogen hoch. Interviews und Artikel etwa im 
Spiegel sorgen auch hier für ein ausgesprochen intensives Interesse der Öf- 
fentlichkeit. Will man sich ein wirklich fundiertes Bild von den aktuellen 
Ergebnissen machen, ist man allerdings auf die Publikation von Grabungs- 
berichten angewiesen, die in der Regel erst Jahre später, oftmals auch gar 
nicht publiziert werden. Das Fehlen aktuellster Informationen erschwert 
und verzögert nicht allein eine solide Meinungsbildung beim Fachwissen- 
schaftler, es macht es auch nahezu unmöglich, auf solche aktuellen Proble- 
me und Tendenzen in der akademischen Lehre zu reagieren. Eine adäquate 
Stellungnahme oder ein Reagieren auf Anfragen aus Kreisen von Nichtspe- 
zialisten ist so kaum möglich. 


1 Vgl. Christoph Ulf (Hg.): Der neue Streit um Troja. Eine Bilanz. München 22004. 

? Rainer Wiegels und Winfried Woesler (Hg.): Arminius und die Varusschlacht. Geschichte - My- 
thos — Literatur. Paderborn u.a. 32003. — Rainer Wiegels (Hg.): Die Fundmünzen von Kalkriese 
und die frühkaiserzeitliche Münzprägung. Akten des wissenschaftlichen Symposions in 
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2. Bilder in der (Altertums-)Wissenschaft 


Genau dieses Problem steht im Mittelpunkt eines Projekts an der Universi- 
tät Hamburg, das die möglichst zeitnahe multimediale Dokumentation von 
zentralen archäologischen Befunden und deren altertumswissenschaftliche 
Einbettung zum Ziel hat. Dabei geht es zum einen gerade darum, den ge- 
schilderten Defiziten entgegenzuwirken und über Interviews sowie die 
Aufnahme von Befunden einen deutlich schnelleren Austausch von neuen 
Erkenntnissen zu ermöglichen. Darüber hinaus lässt sich mit entsprechen- 
der Software aufgrund der erfassten Daten ein Zwischenstand visualisie- 
ren, der wiederum zu weiteren Forschungsdiskussionen anregen kann. 
Speziell für den Einsatz in der Lehre gilt es, die suggestive Kraft der Bilder 
durch entsprechende Kommentare und spezifische Quellenkritik zu flan- 
kieren. Außerdem müssen je nach Zielpublikum zu jedem Themenbereich 
einzelne Sequenzen didaktisch aufbereitet werden. Der Nutzer kann nicht 
allein gelassen werden mit dem Rohmaterial.’ 

Bilder haben schon immer ihren Sitz in der Wissenschaft. Sie dienten als 
Quellen wissenschaftlicher Erkenntnis, als methodische Hilfsmittel, zum 
Sichtbarmachen des Nichtsichtbaren und nicht zuletzt als Instrument zur 
Wissensvermittlung. „Durch wissenschaftliche Zeichnungen, Graphen, 
Diagramme, Computerprogramme, Photographien, Röntgenbilder, Karto- 
graphien etc. wird wissenschaftliches Wissen überhaupt erst in eine stabile, 
aussagekräftige und kommunizierbare Form gebracht.“ Eben diese Eig- 
nung zur Kommunikation ist auch Voraussetzung für den Wissenstransfer. 
Längst sind Bilder, die über den rein wissenschaftlichen Bereich hinausge- 


Kalkriese, 15.-16. April 1999 (Osnabrücker Forschungen zu Altertum und Antikerezeption 3). 
Möhnesee 2000. 


° Didaktischer Mehrwert entsteht nicht einfach durch Medieneinsatz allein, sondern nur durch 
sorgfältiges didaktisches Design. Vgl. Günter Dörr und Peter Strittmatter: Multimedia aus päd- 
agogischer Sicht. In: Ludwig J. Issing und Paul Klimsa (Hg.): Information und Lernen mit Multi- 
media und Internet. Weinheim 2002. S. 144 - Carmen Ueckert: Interaktionsstrukturen universi- 
tärer Lehre mit neuen Medien. In: Bernd Pape, Detlev Krause und Horst Oberquelle (Hg.): Wis- 
sensprojekte. Gemeinschaftliches Lernen aus didaktischer, softwaretechnischer und organisatori- 
scher Sicht (Medien in der Wissenschaft 27). Münster u. a. 2004. S. 128-147. 


* Dazu jetzt vor allem Gyula Pápay: Bilder der Wissenschaft - Wissenschaft der Bilder. Einleiten- 
de Bemerkungen zur allgemeinen Bildwissenschaft. In: Ders. (Hg.): Bilder der Wissenschaft — 
Wissenschaft der Bilder. Rostock 2005. S. 7-18. 


5 Monika Dommann und Mariette Meiner: Wissenschaft, die Bilder schafft. In: Dies. (Hg.): Wis- 
senschaft, die Bilder schafft. Zürich 1999. S. 15. 
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hen, zum Untersuchungsgegenstand geworden, eine allgemeine Bildwis- 
senschaft ist in der Genese begriffen.‘ 

Der Siegeszug des Bildes ist kaum aufzuhalten. Während bei Platon Bil- 
der dem abstrakt-begrifflichem Denken noch klar untergeordnet werden, 
gewinnt heute das Bild dem schriftlich geäußerten Gedanken gegenüber 
oft genug die Oberhand. Man mag dies beklagen, die Überflutung durch 
die Medien geißeln und wie Jean Baudrillard Bilder als „Mörder des Rea- 
len“ bezeichnen, dennoch kommt man nicht umhin, sich der Herausforde- 
rung durch die Dominanz des Visuellen zu stellen.” In ihrer einschlägigen 
Untersuchung kommt Barbara M. Stafford zu dem Ergebnis, dass in unse- 
rer Kultur das Bild die Schrift bereits an Bedeutung überflügelt hat. Seit 
den 1990er Jahren charakterisiert man diese Entwicklung regelrecht als 
‚magic turn‘, ‚pictorial turn‘ oder ‚iconic turn‘. 

Wie ist hier die Altertumswissenschaft aufgestellt? Kurz gesagt: 
schlecht! Abgesehen von der Nutzung digitaler Techniken für den ganz in 
konservativen Bahnen verlaufenden Umgang mit Bildmaterial (Stichwort 
‚Digitale Diathek‘ oder ‚Bilddatenbank‘ zum Beispiel archäologischer Ob- 
jekte) tut sich nur allmählich etwas in Richtung eines bewussten Bemühens 
um die Gestaltung von Bildern. Meist werden wirkmächtige Animationen 
von Medienspezialisten, und zwar nicht zuletzt den Herstellern von Com- 
puterspielen, entwickelt, die über keinerlei fachlichen Hintergrund verfü- 
gen. 

Hier gilt es dringend, den Schritt aus dem Elfenbeinturm zu wagen, 
sonst verlieren wir auch den Rest an Einfluss auf die Bilder, die den Wis- 
senstransfer in breiten Kreisen der Bevölkerung schon heute dominieren. 
An diesem Punkt setzt das Projekt Römer und Germanen — Konfrontation und 
Integration an. 

Unter wissenschaftlichen Gesichtspunkten sollten die Chancen filmi- 
scher Dokumentation sowie der Entwicklung von 3D-Rekonstruktionen 
und Animationen aller Art genutzt werden, um eine Beschleunigung und 
Dynamisierung der Fachdiskussion zu ermöglichen. Über die Medientech- 


é Klaus Sachs-Hombach: Die Magdeburger Bemühungen um eine allgemeine Bildwissenschaft. 
In: Gyula Pápay (Hg.): Bilder der Wissenschaft - Wissenschaft der Bilder. Rostock 2005. S. 41-51. 


7 Vgl. Hans Belting: Bild-Anthropologie. München 2001. S. 18. 


ê Barbara M. Stafford: Kunstvolle Wissenschaft, Aufklärung, Unterhaltung und der Niedergang 
der visuellen Bildung. Amsterdam, Dresden 1998. 


° Pápay, wie Anm. 4, S. 10. 
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nik lassen sich etwa archäologische Befunde auch im Zwischenstand doku- 
mentieren, man muss nicht viele Jahre oder Jahrzehnte auf Grabungspubli- 
kationen warten, sondern kann sofort buchstäblich ‚in medias res’ gehen. 
Ein zusätzlicher Effekt ergibt sich aus der schlaglichtartigen Aufnahme, die 
unter Umständen wissenschaftshistorisch höchst interessante Einblicke in 
die Genese der Erkenntnisse oder einer Lehrmeinung zu einem umstritte- 
nen Sachverhalt bieten kann. So kann das Material selbst zur Quelle für 
wissenschaftsimmanente Prozesse werden. 


Abbildung 1: Interview mit Dr. Andreas Boos (Regensburg) zu 


aktuellen Grabungsergebnissen. 


Prinzipiell ändert auch der kreative Umgang mit digitalen Techniken und 
Speichermedien nichts an den Methoden des Historikers. Mediendaten 
müssen selbstverständlich mit den üblichen historischen Quellen kombi- 
niert werden. Heuristik und Hermeneutik büßen nichts von ihrer Bedeu- 
tung ein. Bei der Darstellung der Untersuchung gilt es jedoch noch mehr 
Aspekte zu berücksichtigen als bisher. Unabdingbar ist die intensive Aus- 
einandersetzung mit gestalterischen und didaktischen Prinzipien, keines- 
falls kann man Rohmaterial unbearbeitet aus der Hand geben, ansonsten 
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wirkt die lieblose Bearbeitung wie ein negativer Kommentar, selbst wenn 
man dies gar nicht beabsichtigt. 

Dringend notwendig wäre eine Diskussion über Archivierungs- und 
Nutzungskonzepte solcher Daten. Videoserver können eine wichtige Basis 
bieten. Derzeit erlaubt der Datendurchsatz im WWW noch keine adäquate 
Nutzung von Videodaten.' In dem Hamburger Projekt fiel daher die Ent- 
scheidung für die DVD als Medium zur Verbreitung und dies lag nicht zu- 
letzt an den weiteren Facetten des Projektes, das neben der wissenschaftli- 
chen Seite im Sinne der Nachhaltigkeit auf ein breites Publikum und eine 
(teilweise) Refinanzierung durch Vermarktung zielte. 


3. „Römer und Germanen - Konfrontation und Integration“ 


Schon bei den Vorüberlegungen zum Projekt Römer und Germanen wurde 
auf zeitgemäße Bezüge, den ‚Sitz im Leben’, geachtet. Erleichtert wurde 
dieses Bemühen, weil aktuelle Forschungsergebnisse zum Thema ‚Konflikt- 
lösung und Integration im Zusammenleben von Römern und Germanen’ 
eine teils frappierende Ähnlichkeit antiker und heutiger Probleme im Um- 
gang mit Fremden erkennen lassen. Im Rahmen der inzwischen fertigge- 
stellten Multimedia-Anwendung werden Problemlösestrategien aufgezeigt 
und Denkanstöße für die heutige Zeit gegeben. Der kombinierte Einsatz 
neuer Techniken mit einem handlungsorientierten Lernkonzept trägt dazu 
bei, dass auch die vermittelten althistorischen Inhalte und die Komplexität 
historischer Prozesse von den Nutzern dauerhaft memoriert werden. 

Im Einzelnen geht es um den effizienten Wissenstransfer mittels interak- 
tiver Multimedia-Anwendungen, die ein zeitgemäßes Erlernen der fachli- 
chen Inhalte ermöglicht. Die Visualisierung erfolgte vor allem über Filmse- 
quenzen, die nicht allein dokumentarische Zeugnisse, sondern zur besse- 
ren Veranschaulichung auch Szenen an Originalschauplätzen enthalten. 
Ziel war es, einerseits ein Lern- und Trainingsprodukt für den Erwerb zen- 


1 In anderen Bereichen der Wissenschaft wird - wenn auch ohne die spezielle Ausrichtung auf 
Videodaten — die Entwicklung von ähnlichen Konzepten und deren Umsetzung in die Praxis 
energisch vorangetrieben. Eine solche Entwicklung wurde etwa am Institut für Multimediale 
und Interaktive Systeme (IMIS) in Lübeck realisiert. Vgl. Barbara Kleinen: Wissensarchive in der 
Praxis. In: Bernd Pape, Detlev Krause und Horst Oberquelle (Hg.): Wissensprojekte. Gemein- 
schaftliches Lernen aus didaktischer, softwaretechnischer und organisatorischer Sicht (Medien in 
der Wissenschaft 27). Münster u. a. 2004. S. 158-174. 
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traler Kenntnisse über die innere Struktur und Gesellschaft des Imperium 
Romanum zu erstellen, andererseits aber auch das Thema ‚Fremdenfeind- 
lichkeit und Integration von Minderheiten‘ exemplarisch in neuem Licht zu 
behandeln. 

Insbesondere durch die Dreharbeiten an gegenwärtigen Brennpunkten 
der Archäologie und Alten Geschichte konnten aktuellste Forschungser- 
gebnisse gesichert und aufbereitet werden, deren anderweitige Publikation 
noch auf Jahre hinaus auf sich warten lassen wird. 

Schon bei den Planungen spielte der Wissenstransfer über die Grenzen 
der eigenen Universität und der Wissenschaft an sich hinaus eine wesentli- 
che Rolle. Daher wurde schon im Vorfeld die Vermarktung der Ergebnisse 
ins Auge gefasst und eine diesbezügliche Kooperationsvereinbarung mit 
einem kompetenten Partner aus der Wirtschaft ausgehandelt. Im Einsatz 
digitaler Techniken konnten neue Felder erschlossen werden: 3D-Animatio- 
nen wurden angefertigt und für die Nachbearbeitung des Tons die School 
of Audio Engineering (SAE) in Hamburg gewonnen. In den Bereichen Ent- 
wicklung und Vertrieb ist eine enge Kooperation mit dem Institut für Film 
und Bild in Wissenschaft und Unterricht in München (FWU) Kernstück des 
Projekts. 

Aus den erarbeiteten Materialien wurden Lerneinheiten für die inne ru- 
niversitären Lernplattformen geschaffen sowie eine didaktische DVD mit 
DVD-ROM-Teil für den Einsatz in der Schule und ein breiteres Publikum 
erstellt. Marketingstrategien sind vorhanden und wurden mit dem FWU 
sowie dem Multimedia-Kontor Hamburg (MMKH) als weiterem Partner 
abgestimmt. 

Inzwischen wurde die DVD erfolgreich im Beisein von Journalisten re- 
gionaler wie überregionaler Tageszeitungen sowie von Radio- und Fern- 
sehreportern in der Gelehrtenschule des Johanneums in Hamburg sowie in 
weiteren Schulen in Bayern und Rheinland-Pfalz getestet. Das überaus po- 
sitive Echo in der Presse ließ die Absatzzahlen hochschnellen. 
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FWU = Schule und Unterricht DVO 46 02335 


Römer und Germanen - 
Konfrontation und 
„integration 
® es _ Tr i a 


Abbildung 2: Cover der DVD „Römer und Germanen - 
Konfrontation und Integration“ (2005). 


4. Perspektiven 


Was die Perspektiven angeht, so eröffnet die professionelle Produktion ei- 
ner didaktischen DVD in Kooperation mit einem Partner aus der Wirtschaft 
sowohl im Hinblick auf die Kompetenz des Teams als auch auf den Bild 
und Filmstock enormes Potential für weitere Produktionen, die angesichts 
der Vorarbeiten deutlich preisgünstiger realisiert werden können. Mittel- 
fristig kann sogar eine Kostendeckung angestrebt werden. 

Dabei ergibt sich sowohl in der Forschung als auch in der Lehre (Einsatz 
des Materials auf der Lernplattform, zusätzliche Lehrveranstaltungen zu 
fachspezifischer EDV) ein effektiver Zugewinn an Ressourcen. 


Digitale Urkundenbücher zur mittelalterlichen Geschichte 


Jürgen Sarnowsky 


Die digitalen Medien haben international für die wissenschaftliche Arbeit 
in den Geisteswissenschaften mittlerweile grundlegende Bedeutung er- 
langt, so dass in diesem Kontext dafür immer häufiger zu Recht von 

E-Science - oder mit einem Begriff von Manfred Thaller: ‚E-Humanities’ — 
die Rede ist, auch in Abgrenzung vom E-Learning. Der virtuelle Besuch 
in Bibliotheken mit Katalogen, Datenbanken und digitalen ‚Nachschlage- 
werken’ ist inzwischen ebenso selbstverständlich wie die Heranziehung 
digitalen Materials in multimedialer Form, sei es über das World Wide 
Web, sei es auf CD oder DVD. Dazu gehört auch ein wachsendes Angebot 
an digitalen Urkundenbüchern, nicht zuletzt für den Bereich der mittelal- 
terlichen Geschichte.' Die Bearbeitung des Materials geschieht auf zweifa- 
che Weise: Zumeist werden die gedruckten Urkundenbuch-Editionen - in 
unterschiedlicher Form — digitalisiert, erschlossen und durch weiteres 
Material ergänzt, teilweise erfolgt aber auch eine Neuaufnahme von 
Quellen. Schon angesichts der Tatsache, dass herkömmliche Urkunden- 
buchprojekte bei breiterer Überlieferung aus dem späteren Mittelalter 
vielfach ins Stocken geraten sind, bieten digitale Publikationsformen eine 
denkbare Alternative. Technisch finden sich inzwischen die verschiedens- 
ten Lösungen: die bildliche Wiedergabe bereits gedruckter Sammlungen, 
teilweise begleitet von digitalen Textfassungen; einfache HTML- oder 
auch XML-Lösungen mit hierarchischen Strukturen und sukzessiver Er- 
schließung von Materialien; immer wieder erweiterte Datenbank-Lösun- 
gen, und vieles andere mehr. Die Quellen sind teilweise durch Abbildun- 


1 Eine gute Übersicht bietet die von Georg Vogeler und anderen betreute Seite zu den Histori- 
schen Hilfswissenschaften, Urkundenbüchern und Regestensammlungen. Adresse: http://www. 
vl-ghw.uni-muenchen.de/chartularia.html (letzte Einsichtnahme am 25.03.2006). 
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gen von Originalen und Karten ergänzt; sie werden durch Suchmaschi- 
nen erschlossen. 

Seit einigen Jahren wird vor diesem Hintergrund eine intensive Dis- 
kussion um Standards geführt, nicht zuletzt um eine angemessene Aus- 
zeichnung bzw. Indexierung der Dokumente,” ebenso aber um die sinn- 
volle Präsentation des Materials in digitaler Form.’ Insbesondere die bild- 
liche Wiedergabe der alten Druckausgaben hat die Anlehnung an das 
Erscheinungsbild von Drucken gefördert, so dass eine Reflexion über die 
Möglichkeiten von digitalen Urkundenbüchern und die Anforderungen 
an sie notwendig ist. Dies soll in diesem Beitrag gewissermaßen aus dop- 
pelter Perspektive geschehen: aus der des Bearbeiters von drei digitalen 
Urkundenbüchern, des Virtuellen Preußischen Urkundenbuchs, des Virtuel- 
len Hamburgischen Urkundenbuchs und der international angelegten Hospi- 
taller Sources’ sowie aus der des Benutzers. Ich werde dabei an Überlegun- 
gen anschließen, die ich vor einem Jahr auf einer Tagung in Mainz vorge- 
stellt habe.” Technische Aspekte sollen hier eher zurückstehen, ebenso die 


? Zur Münchner Tagung von 2004 und der daraus hervorgegangenen Arbeitsgruppe vgl. die Über- 
sicht unter Adresse: http://www.geschichte.uni-muenchen.de/ghw/UrkDTD_Expose.shtml (letzte 
Einsichtnahme am 27.03.2006), die Startseite der Arbeitsgruppe (Charters Encoding Initiative) un- 
ter Adresse: http://www.cei.lmu.de (letzte Einsichtnahme am 27.03.2006) mit dem Vorschlag für 
eine ‚tag library‘ sowie Georg Vogeler: Ein Standard für die Digitalisierung mittelalterlicher Ur- 
kunden mit XML. Bericht von einem internationalen Workshop in München 5.-6. April 2004. In: 
Archiv für Diplomatik 50 (2004). S. 23-34. - Vgl. auch die Beiträge von Markus Heller und Georg 
Vogeler in diesem Band. 


° Dazu siehe insbesondere Patrick Sahle und Georg Vogeler: Urkundenforschung und Urkunde- 
nedition im digitalen Zeitalter. In: Geschichte und Neue Medien in Forschung, Archiven, Biblio- 
theken und Museen. Tagungsband .hist2003. Hg. von Daniel Burkhardt, Rüdiger Hohls und Vera 
Ziegeldorf (Historisches Forum. Schriftenreihe von Clio-online 7,1). Berlin 2005. S. 333-382; vgl. 
die Online-Fassung: http://edoc.hu-berlin.de/e_histfor/7_/PHP/Publikationen_7-2005-1.php#005008 
(letzte Einsichtnahme am 27.03.2006). 


t Zum Stand vgl. Jürgen Sarnowsky: Hospitaller Sources - a Project for a Source Book in the In- 
ternet. In: Bulletin of International Medieval Research 8 (2002, erschienen 2003). S. 13-20. - Ders.: 
Das virtuelle Hamburgische Urkundenbuch - ein digitales Editionsprojekt. In: Hansische Ge- 
schichtsblätter 121 (2003). S. 161-170. - Ders.: Das virtuelle Preußische Urkundenbuch - neue 
Wege der Kooperation für Internet-Editionen, revidierte Fassung. In: Beiträge zur Geschichte 
Westpreußens 19 (2004, erschienen 2005). S. 257-266. 


5 Auf dem Workshop Buch und Internet - Aufbereitung historischer Quellen im digitalen Zeitalter 
der Regesta Imperii an der Akademie der Wissenschaften und der Literatur in Mainz, ab- 
stract(s) unter Adresse: http://regesta-imperii.uni-giessen.de/downloads/onlinedokumente/ 
workshopmaterialien.pdf (letzte Einsichtnahme am 27.03.2006). 
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sich im Bereich E-Humanities bildenden Strukturen.‘ Ausgehend von ei- 
nigen allgemeineren Überlegungen in neueren Publikationen zum The- 
ma, sollen in diesem Beitrag zunächst einige Urkundenbücher im Internet 
vorgestellt und analysiert werden. Daran sollen sich eine Auswertung 
und die Formulierung von Forderungen und Möglichkeiten für Weiter- 
entwicklungen anschließen. 

Am Beispiel des Hansischen Urkundenbuchs haben Patrick Sahle und 
Thorsten Schaßan schon vor einigen Jahren, in einem im Jahr 2000 er- 
schienenen Aufsatz, ihre Vorstellungen und Anforderungen an ein Ur- 
kundenbuch im Internet formuliert.” Dabei haben sie eingangs folgende 
Erwartungen formuliert: 


— Die digitale Version des Urkundenbuchs soll die Quellen besser nutzbar 
und verfügbar machen; 

— sie soll „das in den Texten, Regesten, Anmerkungen oder Registern, teil- 
weise aber auch in den Layoutstrukturen vorhandene Wissen in einer 
Weise explizit werden lassen, die neue Zugriffswege und Nutzungsfor- 
men erlaubt“? 

- sie soll offen sein für jede Art von Ergänzungen und Änderungen; 

— sie soll so zugleich dazu anregen, dass die Strukturen und Funktionen 
derartiger Quellensammlungen überprüft und gegebenenfalls modifi- 
ziert werden. 


Um diese Ziele zu erreichen, soll ein mehrstufiger Prozess durchlaufen 
werden, der von der automatisierten Textaufnahme durch Texterkennung 
über die Ergänzung zusätzlicher struktureller und inhaltlicher Informa- 
tionen zu einem ‚offenen Informationssystem’ führen soll. Bei der Texter- 
fassung ist auf die Übertragung des Layouts zu achten, da die Formatie- 


é Vgl. zum Beispiel das Trierer ‚Kompetenzzentrum für elektronische Erschließungs- und Publi- 
kationsverfahren in den Geisteswissenschaften‘, http://germazope.uni-trier.de/Projects/KoZe2 
(letzte Einsichtnahme am 27.03.2006). In Hamburg das Zentrum ‚Geisteswissenschaften in der 
digitalen Welt‘, http://www.phil-gesch.uni-hamburg.de/gdig/gdigstart.html, und die Hamburg 
Digital Humanities, http://[wwwl1.uni-hamburg.de/narratologie/hdh/index.html. 


7 Patrick Sahle und Thorsten Schaßan: Das Hansische Urkundenbuch in der digitalen Welt. In: 
Hansische Geschichtsblätter 118 (2000). S. 133-155. 


ê Sahle/Schaßan, wie Anm. 7, S. 133. - Vgl. auch die allgemeinen Überlegungen in Patrick Sahle: 
Vom editorischen Fachwissen zur digitalen Edition. Der Editionsprozeß zwischen Quellenbe- 
schreibung und Benutzeroberfläche. In: Fundus. Forum für Geschichte und ihre Quellen 2 (2000). 
S. 75-102. 
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rungen des Drucks immer schon eine Bedeutung transportieren. Texte 
und Textformate sollen in eine einfache, maschinenlesbare Form gebracht 
und so vielfältig, bis hin zur Generierung von Wörterbüchern, nutzbar 
gemacht werden. Ergänzungen wären dann durch interaktive Verschlag- 
wortung durch die Nutzer, Vernetzung mit weiteren Informationsquellen, 
Korrekturen von Fehlern, Aufnahme anderer Fassungen und Abbildun- 
gen der Quellen, Integration von Sekundärliteratur und Anderes zu errei- 
chen. Damit wäre die - ohnehin nicht stringente - Ordnung des gedruck- 
ten Urkundenbuchs durchbrochen, vielmehr würde sich die Frage der 
aufzunehmenden Texte (was sind ‚Urkunden‘) und ihrer Strukturierung 
neu stellen. Auch die Bearbeiter (und der Bearbeitungsstand) wären zu 
berücksichtigen. Wenn dabei Schwächen der gedruckten Fassung — die 
unterschiedlichen Standards und Auswahlkriterien der Bearbeiter und 
Anderes mehr — ausgeglichen werden sollen, bedarf es aber der ‚fachli- 
chen Moderation‘,’ die von Einzelnen nur bedingt geleistet werden könn- 
te. Das gilt auch für die abschließende Forderung, das Konzept von ‚Ur- 
kundenbüchern‘ angesichts der neuen Formen und Möglichkeiten zu 
überdenken, bis hin zur Frage, ob nicht zur Vermeidung von Doppelar- 
beiten die Bearbeitung einzelner Fonds aus den Archiven im Vorder- 
grund stehen sollte, und mit der zutreffenden Feststellung, dass die dau- 
erhafte Betreuung des entstandenen ‚offenen Informationssystems’ nur 
durch eine institutionelle Anbindung gesichert werden kann.” 

Diese Überlegungen haben - ungeachtet der stürmischen Entwicklun- 
gen in diesem Feld - in den letzten sechs Jahren nichts an ihrer Aktualität 
verloren. Einige ergänzende Überlegungen dazu hat zunächst - in mehre- 
ren Beiträgen - Stuart Jenks formuliert, zusammen mit konkreten Umset- 
zungsvorschlägen.'' Seine Vorschläge laufen auf ein Urkundenbuch als 
‚work in progress’ hinaus, dessen Arbeitsergebnisse — vorläufig ohne An- 
spruch auf Vollständigkeit und Erfüllung aller editorischen Standards - 


? So Sahle/Schaßan, wie Anm. 7, S. 145 und 150. 
1 Ebd, S. 154. 


" Siehe unter anderem Stuart Jenks: Das digitale Preußische Urkundenbuch. In: Beiträge zur Ge- 
schichte Westpreußens 17 (2000). S. 181-191. — Ders.: KISS (Keep It Simple, Stupid). Elektronische 
Quelleneditionen mit einfachsten Mitteln. In: Quellen und Quellenedition im neuen Medienzeit- 
alter. Hg. von Stuart Jenks und Felicitas Schmieder (Fundus; Forum für Geschichte und Ihre 
Quellen 2). Göttingen 2002. S. 33-43. - Zuletzt (allerdings auf dem Stand von 2001) ders., Diana 
Kapfenberger und Christina Link: Technischer Fortschritt vs. editorischer Rückschritt. Eine 
falsche Alternative. In: Hansische Geschichtsblätter 122 (2004). S. 149-162. 
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sukzessive im Netz veröffentlicht werden, das heißt der ersten Texterfas- 
sung sollen nacheinander — und jeweils klar erkennbar - die Schritte der 
Identifikation der Orts- und Personennamen, die Verschlagwortung und 
die diplomatische Diskussion folgen. Wesentlich war ihm dabei ein einfa- 
ches Modell, das ohne komplizierte technische Voraussetzungen aus- 
kommt. Die von ihm vorgesehene ‚Pyramidenstruktur der Editionstätig- 
keit‘, die die Textaufnahme an verschiedenen Orten mit der Koordination 
und editorischen Betreuung an zentraler Stelle verbindet, erfordert einen 
hohen Grad an Organisation, um eine einheitliche Erfassung zu ermögli- 
chen, das heißt die Vereinheitlichung der Namensformen für die Ver- 
schlagwortung, eine Übersicht über die verkürzt zitierte Literatur und 
klare hierarchische Strukturen für die jeweiligen Seiten. Dies soll durch 
eine Suchmaschine für komplexe Abfragen ergänzt werden. 

Patrick Sahle und Georg Vogeler haben 2003 - bzw. in ihrem 2005 er- 
schienenen Beitrag — über 40 einschlägige Projekte untersucht, die in der 
Virtual Library Geschichte vorgestellt sind, und dabei weitergehende Über- 
legungen zu ‚Urkundenforschung und Urkundenbüchern‘ angestellt.” 
Ihre Analyse erfolgte auf vier Ebenen: Sie galt der Form der Bereitstellung 
der Urkunden, ihrer Erschließung, den Nutzungsmöglichkeiten und den 
Überlegungen zu möglichen Zielgruppen. Ihre Ergebnisse sollen hier 
nicht im Einzelnen wiederholt werden, doch hat die Untersuchung deut- 
lich gemacht, wie disparat bisher die Gestaltung digitaler Urkundenbü- 
cher ausfällt. Das betrifft sowohl die Präsentation der Quellen im Netz, 
als Bild, Regest und digitaler Volltext, wie auch die Gestaltung der ‚Meta- 
daten’ und den Kontext aus weiterem Material, das der Erschließung der 
Quellen dient. Nach der Erhebung der Autoren bietet nur etwa ein Drittel 
der Projekte neu aufgenommene, nicht schon zuvor gedruckte Texte — mit 
allen Problemen, die dies aufwirft. Sahle und Vogeler schlagen angesichts 
der wachsenden Unübersichtlichkeit im Bereich der digitalen Editionen 
ein Urkundenportal vor, das an das Angebot der Virtual Library Geschichte 
anknüpfen, langfristig die angebotenen Ressourcen miteinander verbin- 
den und formal annähern könnte. Ein wichtiges Ziel wäre die Durchset- 
zung gemeinschaftlicher Standards, um über das Portal auch die Metada- 
ten gemeinsam verwalten zu können. 

Im Folgenden seien einige Beispiele für die Umsetzung von Urkunden- 
büchern im Internet und anderen neuen Medien angeführt und knapp in 


1? Sahle/Vogeler, wie Anm. 3. 
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Beziehung zu den oben formulierten (theoretischen) Erwartungen ge- 
setzt.” 

Eine zumeist nützliche, wenn auch einfache Form der digitalen Präsen- 
tation von Urkundenbüchern ist die Bereitstellung von Scans, wie sie zum 
Beispiel seit 1997 bei der Rheinischen Landesbibliothek Koblenz für das 
1860 erschienene Mittelrheinische Urkundenbuch vorliegen.' Die Navigati- 
on erfolgt über eine Kopfleiste, einen Überblick geben nur die ebenfalls 
im Scan vorliegenden herkömmlichen Register der Personen, Orte und 
Sachen. Ähnlich angelegt ist die digitale Version des Codex Diplomaticus 
Saxoniae Regiae. Hier startet man von der Übersicht über die 25 Bände 
der Reihe und ruft im einzelnen Urkundenbuch über eine Navigations- 
leiste die Stücknummern auf; die Erschließung erfolgt nur über die ge- 
druckte Urkundenübersicht und das Register. In beiden Fällen liegt der 
Vorteil klar darin, ältere Quellenwerke, die selbst in Bibliotheken nicht 
(oder nur unvollständig) vorhanden sind, vom häuslichen Schreibtisch 
aus nutzen zu können. Der Vorteil wird allerdings durch die mangelnde 
Bildqualität dieser und ähnlicher digitaler Urkundenbücher reduziert; im 
ersten Fall ist die Grenze der Lesbarkeit teilweise erreicht. Dazu kommt, 
dass die digitalen Möglichkeiten zur Erschließung und Kommentierung 
der Urkunden nicht genutzt sind. 


1 Hier kann schon aus Zeitgründen kein Anspruch auf Vollständigkeit erhoben werden; vgl. wie- 
derum die Übersicht unter Adresse: http://www.vl-ghw.uni-muenchen.de/chartularia.html (letzte 
Einsichtnahme am 25.03.2006). 


1 Urkundenbuch zur Geschichte der, jetzt die preußischen Regierungsbezirke Coblenz und Trier bil-den- 
den, mittelrheinischen Territorien, Bd. 1: Von den ältesten Zeiten bis zum Jahre 1169. Hg. von Hein- 
rich Beyer. Koblenz 1860. Adresse: http://www.rlb.de/mrHist/91-3152-som/1.1.html (letzte Ein- 
sichtnahme am 25.03.2006). 


15 Adresse: http://isgv.serveftp.org/codex/ (letzte Einsichtnahme am 27.03.2006). - Vgl. auch die 
Digitalisierung des Urkundenbuchs des Hochstifts Merseburg, 1. Theil: 962-1357. Hg. von Paul Fri- 
dolin Kehr. Halle 1899. Adresse: http://141.84.81.24/cgi-bin/MersUB.pl?seite=] (letzte Einsichtnah- 
me am 26.03.2006), Teil eines Projekts zur Merseburger Schriftlichkeit, das unter anderem ein bisher 
nur handschriftlich vorliegendes Verzeichnis der Handschriften der Dombibliothek bietet. 
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CODEX DIPLOMATICUS SAXONIAE REGIAE 


Zu den Urkundenbüchern 


CDSI A 1 - Urkunden der Markgrafen von Meissen 948-1099 CDS II 6 - Urkundenbuch der Stadt Chemnitz und ihrer Klöster 
CDSI A 2- Urkunden der Markgrafen von Meissen 1100-1195 CDS II 7 - Urkundenbuch der Städte Kamenz und Löbau 
CDSI A 3 - Urkunden der Markgrafen von Meissen 1196-1234 CDS II 8 - Urkundenbuch der Stadt Leipzig I 
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Abbildung 1: Startseite des Codex Diplomaticus Saxoniae Regiae. 


LANGOBARDISCHE URKUNDEN (oL 1) 


EINLEITUNG CDL 1 Originalurkunden | Kopial überlieferte Urkunden! Gefälschte oder verfälschte 
Urkunden! Der Fälschungskomplex von Cremona 


Einleitung CDL 2" CODICE DIPLOMATICO LONGOBARDO (2) 


EINLEITUNG (CDL 1) 
Edition: Codice Diplomatico Longobardo (CDL) 1, ed. L. Schiaparelli (Roma 1929). 


Die langobardischen Urkunden bis 774 wurden in den fünf Bänden des Codice Diplomatico Longobardo ediert, die 
mit der Herausgabe der Urkunden von Benevent durch Herbert Zielinski (erscheint voraussichtlich 2003) 
abgeschlossen sein werden. 


Hier sind als Findehilfe die Texte der ältesten Privaturkunden (bis 757) elektronisch erfaßt. Für den Apparat und für 
die exakten Zitate bleibt der Benützer auf den CDL-Band verwiesen. Abweichend vom CDL, wurden die Urkunden 
hier in Originale, Kopien und Fälschungen aufgeteilt, wobei der (rom Barockgelehrten Dragoni angefertigte) 
Fälschungskomplex von Cremona eigens zusammengefaßt wurde. Grundlage der Einteilung war die Edition. Bei 
kopialer Überlieferung, besonders wenn sie zeitfern ist, muß darüber hinaus die Möglichkeit einer Verfälschung 
über das vom Editor angenommene Maß hinaus in Betracht gezogen werden. Die Originalurkunden sind inzwischen. 
als Faksimile mit Transkription, ausführlichem Apparat und Übersetzung in den betreffenden Bänden der Chartae 
Latinae Antiquiores herausgegeben worden, deren Benützung sich sehr empfiehlt. 


Ausgewählte Literatur: 


e Codice Diplomatico Longobardo, Bd. 1-3, hrsg, L. Schiaparelli, 1929-33; Bd. 3 u. 4,1, hrsg. C. Brühl, 1973-81; Bd. 5, 
hrsg. H. Zielinski, 1986 

o A: Castagnetti, L'organizzazione del territorio rurale nel medioevo, 1979. 

© M. Cavina, Sculdahis rector loci et minor iudex, Rivista della Storia del Diritto Italiano 65, 1992, 145-63. 

© P. M. Conti, La Tuscia e i suoi ordinamenti territoriali nell’alto medio evo. In: Atti del V Congresso intemazionale di 
studi sull‘alto medioevo (Spoleto 1973) 61-116. 


Abbildung 2: Startseite der „Langobardischen Urkunden“. 
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Einen Schritt weiter geht ein privates Vorhaben, die Digitalisierung des 
6. Bandes des Oldenburgischen Urkundenbuches für Jever und Kniphausen.” Sie 
präsentiert die Quellen in der Reihenfolge der Vorlage im HTML-Format, 
verlinkt im Register die Stücknummern mit dem Text und erlaubt eine ein- 
fache Suche nach Nummern und Begriffen. In gewisser Hinsicht vergleich- 
bar sind die in einem weiteren Kontext von Quellen zur langobardischen 
Geschichte angebotenen Langobardischen Urkunden, die für die Annotierung 
ausdrücklich auf die gedruckte Edition von Luigi Schiaparelli verweisen.” 
Die Stücke sind nach den Nummern der Edition in wenigen HTML-Datei- 
en angeordnet, allerdings getrennt nach Originalurkunden, Kopialüberlie- 
ferung und Fälschungen. Beiden digitalen Urkundenbüchern gemeinsam 
ist die Digitalisierung gedruckten Urkundenmaterials, doch ist die Suche 
weiterhin auf die Nummern der Druckausgabe konzentriert; eine Suche 
nach Namen oder Begriffen ist nur über den Browser möglich. Zudem ver- 
zichten gerade die Langobardischen Urkunden auf die in der Druckfassung 
enthaltenen Zusatzinformationen. 

Weit mehr verspricht die Digitalisierung des Corpus Altdeutscher Origi- 
nalurkunden bis 1300 mit rund 4 400 Stücken, von dem bereits eine - aller- 
dings eingeschränkte - Testversion für das Rhein-Maas-Gebiet online ver- 
fügbar ist. Die digitale Textfassung soll nach internationalen Standards 
ausgezeichnet werden und in das Mittelhochdeutsche Textarchiv eingehen, 
wird also in einen größeren Kontext integriert.” 


1€ Startseite: http://www.urkundenbuch.net/index.php (letzte Einsichtnahme am 27.03.2006); ba- 
sierend auf Oldenburgisches Urkundenbuch, VI: Urkundenbuch von Jever und Kniphausen. Hg. von 
Gustav Rüthing. Oldenburg 1932, initiiert durch ein Antiquariat. 


17 Adresse: http://www.oeaw.ac.at/gema/lango_urk.htm (letzte Einsichtnahme am 27.03.2006); 
basierend auf Codice Diplomatico Longobardo. Bd. 1-2. Hg. von Luigi Schiaparelli. Rom 1929-1933. 


18 Startseite unter Adresse: http://germazope.uni-trier.de/Projects/Corpus/start/index.html (letzte 
Einsichtnahme am 27.03.2006); die Testversion für das Rhein-Maas-Gebiet unter http://gepc189. 
uni-trier.de/cgi-bin/iRMnet/RMnetIndex.tcl?hea=gf&for=qfcoraltdu; digitalisiert wird das abge- 
schlossene Corpus der altdeutschen Originalurkunden bis zum Jahr 1300, Bd. I: 1200-1282. Hg. von 
Friedrich Wilhelm; Bd. II: 1283-1292. Hg. von Friedrich Wilhelm und Richard Newald; Bd. IH: 
1293-1296. Hg. von Richard Newald, Helmut de Boor und Diether Haacke. Bd. IV: 1297-(Ende 
13. Jahrhundert). Hg. von Helmut de Boor und Diether Haacke. Bd. V: Nachträge. Hg. von Hel- 
mut de Boor, Diether Haacke und Bettina Kirschstein. Lahr 1932-1986. 


? Die gedruckte Ausgabe des Corpus altdeutscher Originalurkunden wird mit etwas anderen 
Zielen und in räumlicher Beschränkung, durch das 1990 begonnene Trierer Korpus mittelfränki- 
scher Urkunden bis 1330 fortgeführt, Adresse: http://136.199.110.189/cgibin/RMnetIndex. 
tcl?hea=gf&for=qmfranku (letzte Einsichtnahme am 13.02.2005), das zurzeit 324 Urkunden um- 
fasst; zur älteren Version des Projekts vgl. die Beiträge von Andrea Rapp: Computergestützte 
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|Quellenforum 


Forschungsforum Themenforum Kartenforum Quellenforum 


Corpus-der Sie sind hier: Urkunden des Rhein-Maas-Raumes im Rahmen des Corpus der altdeutschen 
altdeutschen Originalurkunden 
Originalurkunden 


z 4 
EEE L | 
| Home 

voriger Datensatz << >> nächster Datensatz 


Reg.1.05 Das sogenannte Ottonische Stadtrecht der Stadt Braunschweig. 
Dreispaltig geschrieben. — — 


Swelichtt voget enen richtere fet an fine ftat - fwaz vor dheme gelent wert 
- dat fal 


1.2.001.13 gelike ftede wefen : alfe it de voget felue ftedegede. 


Swelich man deme anderen fculdich es : vn es ime vorfaketh - entgeit he if 
ime met 


tvge : oder met fime öthe - he ne heuet weder dat gerichte nicht vorloren 
wane dat gelt 


1.2.001.16 alene. 


Swelich man fich finef tvgef beropet vmbe gelt - vn if ime borft wert : he ne 
darf 


1.2.001.18 dheme richte nicht wedden wane ver feill. 


1.2.001.12 


1.2.001.14 


1.2.001.15 


1.2.001.17 


1.2.001,19 Swelich man den anderen w“ndit ove dot feit - vn vlu®chtich wert : heuet 


Abbildung 3: Testversion des „Corpus der altdeutschen Originalurkunden“. 


Bisher kann wiederum nur nach Nummern gesucht bzw. zwischen den ein- 
zelnen Datensätzen ‚geblättert‘ werden. Das sollte sich aber nach Abschluss 
der Arbeiten am Corpus ändern. Da die Edition literaturwissenschaftlichen 
Standards genügen muss, ist auf eine Besonderheit hinzuweisen, die von 
allgemeiner Bedeutung ist: Sie bietet eine diplomatische Edition ohne die 
‚Eingriffe‘ geschichtswissenschaftlicher Editoren und gibt auch graphische 
Zeichen im Text wieder. In der Tat sollten die digitalen Editionen mittelfris- 
tig nicht nur den Anforderungen einer Wissenschaft nachkommen, sondern 
auch Optionen für andere methodische Zugänge eröffnen. 


Verfahren zur Erfassung, Katalogisierung, Bearbeitung und Edition mittelfränkischer Urkunden 
des 13. und 14. Jahrhunderts. In: Maschinelle Verarbeitung altdeutscher Texte V. Hg. von Stephan 
Moser, Peter Stahl, Werner Wegstein und Norbert Richard Wolf. Tübingen 2001. S. 247-261. — 
Dies.: Die elektronische Edition, Erschließung und Vernetzung des Trierer Korpus mittelfränkischer 
Urkunden des 14. Jahrhunderts. In: Jahrbuch für Computerphilologie 2000. S. 147-161. — Dies.: Die 
elektronische Edition, Erschließung und Vernetzung historischer Quellen und Grundlagenwer- 
ke. Das Trierer Korpus mittelfränkischer Urkunden des 14. Jahrhunderts. In: TUSTEP educa. Actas de 
congreso des International TUSTEP User Group. Hg. von Nicölas Castrillo Benito und Peter 
Stahl. Burgos 2001. S. 99-123. 
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MOnasteriuM 
© MOnasteriuM 
& AT österreich ederösterreich 


NOe 
G noe Niederösterreich Bestand: Heiligenkreuz, OCist - Heiligenkreuz, Zisterzienser ( 
1136-1399) 


Ü 008 Oberösterreich 


ao Sbg Salzburg P 
G T Tirol Beschreibung 


O cz česká Republika 
© D Deutschland 
© Hu Magyarorszag 


0 s1 Slovenija Verzeichnungseinheiten: 
Lfd.- 
TEEF Titel Datierung 
yosı 2er päpstliche Cardinal-Legat Conrad bestätigt der Abbtei heiligen 1225. April 1. 
Kreuz das Patronat über die Kirche zu Sulz. Heiligen Kreuz. 


Der päpstliche Cardinal-Legat Conrad bestätigt der Abbtei heiligen 
1/052 Kreuz den unter Vermittelung des Herzogs Leopold von Österreich mit 
der Abbtei Meik abgeschlossenen Vergleich wegen der Zehente. 


1225. April 1 
Heiligen Kreuz. 


Danst Hnnarins IT hastätint der Ahhtai heilinen Kranz das Patranat 1227 Tanııar 


Ergebnisse: <-[1-10] [11-20] [21-30] [31-40] [41-50] [51-60] [61-70] [71-80] [81-90] [91-100] 
101-110] [111-120] [121-130] [131-140] [141-150] [151-160] [161-170] [171-180] [181-190 
[191-200] [201-210] [211-220] [221-230] [231-240] [241-250] [251-260] [261-270] [271-280] 


Abbildung 4: Das „virtuelle Archiv mitteleuropäischer Klöster und Bistümer“. 


Eine komplette ‚Neuschöpfung’ ist das Virtuelle Archiv mitteleuropäischer 
Klöster und Bistümer,” das ein Urkundenbuch als ‚work in progress’ dar- 
stellt, als Gemeinschaftsprojekt niederösterreichischer Archive begann, 
nunmehr aber mehrere Regionen erfasst. Es verbindet Archivfindmittel, In- 
haltsangaben, Beschreibungen, einige Volltexte und Abbildungen mit einer 
Reihe weiterer Hilfsmittel wie einem Glossar und mit Links zu weiteren 
Quellen im Netz. Die Urkunden der bisher erfassten Klöster lassen sich 
über eine zeitlich eingrenzbare Suche erschließen und die allerdings nicht 
immer ganz einfache Navigation erfolgt über eine Mehrfensterlösung.” Der 
besondere Reiz dieser Urkundenpräsentation ist die Zusammenarbeit der 
Archive, die so ihre Bestände besser zugänglich machen. 

Die drei in Hamburg betriebenen Urkundenbücher bieten anders als die 
zuletzt angesprochenen Projekte sowohl bereits gedruckte Quellen - aus an- 
deren Urkundenbüchern, Quellensammlungen und Anhängen in Monogra- 
phien und Aufsätzen — als auch laufend neues Material aus den Archiven, 
das erschlossen und ediert wird. Das virtuelle Preußische Urkundenbuch, das 


20 Adresse: http://www.monasterium.net/ (letzte Einsichtnahme am 27.03.2006). 


21 Indexseite: http://www.mom.findbuch.net/php/main.php?ar_id=3263&action=rech (letzte Einsicht- 
nahme am 27.03.2006). 
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das gedruckte Urkundenbuch für die Jahre 1382 bis 1525 fortsetzen soll,” 
umfasst inzwischen rund 6 100 Stücke (darunter knapp 5 000 digitalisierte 
Regesten aus einem gedruckten Archivrepertorium,” aber auch schon meh- 
rere Hundert Volltexte). Das virtuelle Hamburgische Urkundenbuch für die Jah- 
re 1351 bis 1529 enthält rund 220,” die Hospitaller Sources bieten für den Zeit- 
raum 1310 bis 1522 rund 230 Stücke,” jeweils mit mehr als 50 Prozent Voll- 
texten, mit sehr unterschiedlichem, jeweils ausgewiesenem Bearbeitungs- 
stand. Der Einstieg dazu erfolgt über Jahresregestenlisten, die Erschließung 
bietet teilweise eine einfache Suchmaschine, sofern nicht die Browser-Funk- 
tionen genutzt werden müssen. Alle drei Urkundenbuchprojekte sind inzwi- 
schen in einen größeren Kontext von eigenen und fremden Angeboten einge- 
bunden, der auch Scans älterer Drucke und Bildmaterial einschließt. 

Dieser naturgemäß begrenzte Überblick über digitale Urkundenbücher 
hat zunächst einmal den Eindruck der Vielfalt der Zugänge verstärkt. Tat- 
sächlich erfüllen Sie zumindest einen Teil der eingangs formulierten Anfor- 
derungen. 


— Die digitalen Urkundenbücher machen - dort, wo nicht nur Bilder gebo- 
ten werden - die Quellen besser nutzbar und verfügbar; 

- sie vermitteln mit Ausnahmen auch das jenseits der Urkundentexte im 
Druck ‚gespeicherte‘, erschließende Wissen; 

- sie eröffnen die Möglichkeit zur Vernetzung mit weiteren Quellen und 
Informationen und sind weithin ergänzbar; 

- die Erarbeitung digitaler Editionen hat inzwischen einen Diskus- 
sionsprozess über die künftige Gestaltung dieser Angebote angestoßen. 


Deutlich geworden ist allerdings auch, dass es einer stärkeren Standardisie- 
rung bedarf, sowohl in der Auszeichnung der Texte, damit eine bessere Er- 


2 Adresse: http://www1.uni-hamburg.de/Landesforschung/orden.html (letzte Einsichtnahme am 
27.03.2006). 

2 Erich Joachim (Bearbeiter): Regesta Historico-Diplomatica Ordinis Sanctae Mariae Theutoni- 
corum, 1198-1525. Hg. von Walther Hubatsch. Pars I, Bände 1-3, Pars II, Registerband zu I-H. 
Göttingen 1948-1973, verzeichnet Bestände der XX. Hauptabteilung des Geheimen Staatsarchivs 
Preußischer Kulturbesitz, Berlin (Historisches Staatsarchiv Königsberg). 

% Adresse: http://www1.uni-hamburg.de/hamburgisches_ub/HambUB.html (letzte Einsichtnah- 
me am 27.03.2006). 

3 Adresse: http://www1.uni-hamburg.de/hospitallers/hospitallers.htmil (letzte Einsichtnahme am 
27.03.2006). 
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schließung durch die Suchinstrumente erfolgen kann, als auch in den ‚Min- 
dest‘-Anforderungen an die Urkundenbücher. So sollten Bilder eine gute 
Lesbarkeit garantieren; Scans der Originale müssten idealerweise sogar in 
mehreren Stufen und ‚Auflösungen‘ verfügbar gemacht werden; ein ‚Min- 
dest‘-Satz von Metadaten sollte geboten werden. Das kann leicht mit dem 
von Patrick Sahle und Georg Vogeler vorgeschlagenen Urkundenportal in 
Verbindung gebracht werden: Ein solches Portal, das vielleicht in der Tat 
von der entsprechenden Seite der Virtual Library Geschichte seinen Ausgang 
nehmen könnte, würde eine solche Standardisierung fördern. Ein denbarer 
Nebeneffekt ist auch die Vermeidung von Doppelangeboten. Dieselbe 
Quelle müsste nicht zweimal, etwa für das Hansische und das Preußische 
Urkundenbuch, aufgenommen werden, sondern könnte in beide unter den- 
selben Metadaten integriert werden. 

Diese Überlegung zieht unweigerlich die Frage nach der Finanzierung 
eines solchen Portals nach sich. Im Hamburger Kontext haben sich bei der 
Bearbeitung des Quellenmaterials grundlegende Probleme gezeigt. Die drei 
Projekte sind dem von Stuart Jenks entwickelten Modell eines Urkunden- 
buchs als ‚work in progress’ verpflichtet, das auf der Kooperation zwischen 
mehreren Wissenschaftlerinnen und Wissenschaftlern, aber auch auf der 
Integration von Studierenden aufbaut, die über Lehrveranstaltungen und 
Abschlussarbeiten eingebunden werden sollen.” Es hat sich aber gezeigt, 
dass dieser Ansatz nur sehr begrenzt funktioniert. Der Appell an andere 
Wissenschaftlerinnen und Wissenschafter, die von ihnen digitalisierten 
Quellen in dafür vorliegenden ‚Formularen‘ zur Verfügung zu stellen, hat 
bisher nur wenig Resonanz gefunden” und es sind zumeist nur wenige Da- 
tejen dazugekommen.* Ähnliches gilt für die Einbindung von Studieren- 
den. Selbst innerhalb eines zweijährigen E-Learming-Projekts wurden so 
nur relativ wenige Quellen aufgenommen.” Den Möglichkeiten eines ‚Her- 


% Allgemein dazu wie Anm. 11. 


” Mit Ausnahme der Zusammenarbeit mit Dieter Heckmann und Stuart Jenks (für das Preußi- 
sche Urkundenbuch) sowie mit Klaus-Joachim Lorenzen-Schmidt (für das Hamburgische Urkunden- 
buch). 


® Zu nennen sind hier weiter Arno Mentzel-Reuters, Jan-Erik Beuttel, Marc Schmidt, Pawet Je- 
ziorski und Krzysztof Kopinski (für das Preußische Urkundenbuch) sowie Karl Borchardt (für die 
Hospitaller Sources). 


? Im Rahmen des E-Learning-Projekts Geisteswissenschaften im Internet, Adresse: http://www. 
phil-gesch.uni-hamburg.de/fbelch.html (letzte Einsichtnahme am 15.02.2005), strebte das Teilpro- 
jekt Edition mittelalterlicher Quellen im Internet die Heranführung Studierender ans wissenschaftli- 
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ausgebers’ sind dabei klare Grenzen gesetzt. Nicht zufällig wurde die von 
Patrick Sahle, Thorsten Schaßan und Stuart Jenks vorgeschlagene und in 
der virtuellen Erlanger Fassung des gedruckten Preußischen Urkundenbuchs 
durch ein Eingabeformular realisierte interaktive Verschlagwortung durch 
die Benutzer völlig aufgegeben.” Schon die rein technische Überprüfung 
der in Kooperation bearbeiteten Dateien erfordert einigen Zeitaufwand; 
eine komplette formale Angleichung, die eine Voraussetzung für die Inte- 
gration in ein Urkundenportal wäre, wäre eine ‚hauptamtliche‘ Aufgabe, 
von der Betreuung des Portals ganz zu schweigen. ‚Nebenamtliche‘ Betreu- 
er wären somit überfordert, man müsste ein bundesweites oder über 
Deutschland hinausreichendes Projekt beantragen, ähnlich wie für das Vir- 
tuelle Archiv mitteleuropäischer Bistümer und Klöster, das aber auch eine lang- 
fristige Pflege ermöglicht. 

Ingrid Heidrich hat 2004 in einer Rezension des virtuellen Hamburgi- 
schen Urkundenbuchs unter anderem die wenig spezifische Suchfunktion 
und die Zersplitterung des Materials kritisiert.” Die Suchfunktionen sind in 
der Tat ein wichtiges Element, das bisher - wie bei vielen Projekten - unzu- 
reichend ausgebildet ist; während die Disparatheit des in den drei Ham- 


che Arbeiten und an die digitale Quellenedition an. Die wenigen größeren Projekte, die daraus 
erwachsen sind, sind noch nicht abgeschlossen. Allerdings bieten die Dateien von Sebastian Ku- 
bon und Martin Neumann (für das Preußische Urkundenbuch), Mathias Nagel, Annika Souhr, Jea- 
nine Marquard und Susanne Dreyer (für das Hamburgische Urkundenbuch) sowie von Manuela 
Plener, Maike Claußnitzer und Marcus Prey (für die Hospitaller Sources) jeweils wichtige Ergän- 
zungen (neben weiteren ‚Vorarbeiten‘ aus Seminaren). Größere Beiträge für das Preußische Ur- 
kundenbuch wurden zudem durch Hilfskräfte erarbeitet (Frauke Schmitz, Jorun Poettering, Joa- 
chim Laczny und Markus Kompisch). 


2 Dazu unter anderem Jenks und andere, Fortschritt, wie Anm. 11, S. 159. - Das Formular gene- 
rierte eine E-Mail an Stuart Jenks, der dann sein Stichwortregister, das er für die früheren, aus 
dem gedruckten Urkundenbuch stammenden Teile angelegt hat, entsprechend ergänzt hätte. 
Dieses Tool wurde jedoch nie ernsthaft genutzt — ein Argument für die ‚Filterung‘ durch einen 
Bearbeiter -, andernfalls aber wäre der Arbeitsaufwand erheblich gewesen. 


1 Veröffentlicht unter der Adresse: http://hsozkult.geschichte.hu-berlin.de/rezensionen/id=64& 
typesrezwww (letzte Einsichtnahme am 05.11.2004; 28.03.2006). — Kleinere Kritikpunkte Heid- 
richs sind durchaus diskussionswürdig. Die Frage, ob ein ‚Impressum‘ (im Netz ohnehin etwas 
ungewöhnlich) erforderlich ist, ist meines Erachtens sekundär, wenn die Betreuer und Bearbeiter 
des Projekts mit Kontaktadressen genannt sind. Dagegen sollte jede Einzeldatei eindeutig die 
Identifikation als Teil des Gesamtprojekts erlauben, da sie ja über Suchmaschinen einzeln er- 
schließbar sein sollte. Der Verzicht auf eine Kopfzeile „Das virtuelle Hamburgisches Urkunden- 
buch“ ist daher nicht denkbar, auch wenn natürlich die graphische Gestaltung immer Frage des 
Geschmacks ist. Allerdings sollte eine gute Lesbarkeit gewährleistet sein (was vielleicht heute 
nicht immer der Fall ist), ebenso ohne zuviel Scrollen. 
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burger Projekten bisher dargebotenen Materials eine Folge des kooperati- 
ven Vorgehens darstellt, das auf Masse setzt, die nur - und das auch nur 
mit Einschränkungen - im Fall des Preußischen Urkundenbuchs erreicht ist. 
Ein Urkundenportal sähe sich beiden Problemen in höherer Potenz gegen- 
über. Der Zugriff der Suchinstrumente müsste auf das gesamte, auf ver- 
schiedenen Servern liegende Material zielen, aber auch spezifizierte Einzel- 
abfragen ermöglichen, und anders als beim Virtuellen Archiv mitteleuropäi- 
scher Bistümer und Klöster fehlte eine inhaltliche Klammer. Dennoch sollte 
der Versuch unternommen werden, ein derartiges Urkundenportal ins 
Leben zu rufen und die genannten Schwierigkeiten zu überwinden. 

Das forschende Mitglied der E-Humanities, der mit digitalen Medien 
arbeitenden Geisteswissenschaften, wird aus heutiger Perspektive wahr- 
scheinlich mittelfristig eine Reihe von Erwartungen an die digitalen 
Urkundenbücher zur mittelalterlichen Geschichte richten, die nur durch 
verstärkte Diskussion und Kooperation — und letztlich über ein Urkunden- 
portal — zu erreichen sind: 


- Wie schon heute, wird auch künftig in der digitalen Welt vor allem die 
Schnelligkeit des Zugriffs zählen. Das ist bereits der Vorteil der als Bild 
digitalisierten Publikationen, die bei aller Problematik die — nicht immer 
leichte — Beschaffung über die Bibliotheken ersetzt; umso besser ist, 
beim digitalen Zugriff nicht mehr nur ein Urkundenbuch, sondern 
gleich mehrere — oder möglichst viele - mit den eigenen Fragestellungen 
durchzusuchen zu können. Der so erreichbare Fortschritt ist heute be- 
reits im Bereich der Handschriften erkennbar, für die die Seite der Ma- 
nuskripta Medieaevalia über 40 000 Manuskripte erschließt.” 

- Die Nutzer des Urkundenportals werden eine stärkere Standardisierung 
erwarten. Dazu gehört sicherlich die einheitliche Auszeichnung der Tex- 
te, ohne die die Suchinstrumente unzuverlässige Ergebnisse erzeugen 
würden, dazu gehört aber auch eine technische Annäherung und ein 
vergleichbarer Stand der Hilfsmittel-Angebote. Gerade in letzterer Hin- 
sicht kann ein Portal Erleichterungen bringen, durch die Kooperation 
zwischen verschiedenen Projekten. 

— Schließlich werden die Nutzer hoffen, dass es zu einer Verdichtung und 
Verbesserung des Angebots kommt. Die Probleme eines kooperativen 


2 Adresse: http://www.manuscripta-mediaevalia.de/ (letzte Einsichtnahme am 28.03.2006). - 
Dort haben allerdings urheberrechtliche Probleme zur Reduktion des Angebots geführt. 
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Vorgehens ohne tragfähige Projektförderung habe ich gerade am Beispiel 
der Hamburger Urkundenbuchprojekte verdeutlicht. Die - möglichst eu- 
ropaweite - Zusammenarbeit zwischen Urkundenbuchprojekten, auch in 
Gestalt eines gemeinsamen Portals, könnte auf dreifache Weise im Sinne 
der angesprochenen Erwartung wirken. Zum einen würde sie eine ver- 
tiefte Debatte über die Formen der Bereitstellung von Quellen anstoßen, 
die auch die Nutzer einbezieht; zum anderen könnten gemeinsame 
Werkzeuge entstehen, die die kooperative Arbeit an den Projekten er- 
leichtert, zum Beispiel so etwas wie ein ‚Autorentool’ für die beteiligten 
Wissenschaftlerinnen und Wissenschaftler; und schließlich ließe sich ge- 
meinsam - auch mit interessierten Archiven - vielleicht mit größerer Aus- 
sicht auf Erfolg eine Finanzierung für das Projekt finden. 


Schon heute ist Forschung außerhalb der digitalen Welt kaum mehr - oder 
vielleicht schon: nicht mehr - möglich, die Tendenz wird sich weiter ver- 
stärken. Die wachsende Vielfalt von Quellenangeboten im World Wide 
Web bedarf auch der Qualitätssicherung, die nur durch Zusammenarbeit 
erreichbar ist. Die Diskussion über die digitalen Urkundenbücher zur mit- 
telalterlichen Geschichte kann einen wichtigen Beitrag dazu leisten. 


Verborgen, vergessen, verloren? 


Perspektiven der Quellenerschließung durch die digitalen 
Regesta Imperii 


Dieter Rübsamen und Andreas Kuczera 


Die Regesta Imperii präsentieren sich heute — wie schon seit Jahrzehnten — 
als eines der meistgenutzten mediävistischen Grundlagenwerke zur euro- 
päischen Geschichte des Mittelalters. Das von dem Frankfurter Stadtbiblio- 
thekar Johann Friedrich Böhmer im ersten Viertel des 19. Jahrhunderts ini- 
tiierte und zunächst weitgehend im Alleingang betriebene Unternehmen 
hatte als vorderstes Ziel, zu jedem Herrscher, worunter die römisch-deut- 
schen Kaiser und Könige sowie für etliche Epochen auch die Päpste zählen, 
eine lückenlose Dokumentation der jeweiligen Person(en) und ihres politi- 
schen Handelns vorzulegen. Diese Herrscherregesten wurden - zumal in 
den älteren Bänden - ergänzt von ‚Reichssachen‘, worunter zumeist ur- 
kundliches Material, das in irgendeinem inhaltlichen Bezug zur Reichsge- 
walt steht, zu verstehen ist. Zur Erstellung eines im Idealfall vollständigen 
Itinerars, also eines lückenlosen Nachweises der Aufenthaltsorte und der 
dortigen Anwesenheitszeit eines Herrschers, mithin der Reiseweg des noch 
nicht durch Residenzen örtlich verfestigten Königtums, wurden alle schrift- 
lichen Quellen mit entsprechendem Herrscherbezug herangezogen: in ers- 
ter Linie Urkunden, deren Datierungsangaben eindeutige chronologische 
Zuordnungen erlauben, daneben aber auch - und gerade für die früheren 
Epochen wichtig - Historiographisches. Die Böhmersche Grundkonzeption 
sah dabei durchaus eine Bescheidung auf die dienende Funktion zur Er- 


! Dem Tagungscharakter entsprechend wird die Vortragsfassung für die Druckversion beibe- 
halten. Anstelle von Literaturangaben zu den Regesta Imperii sei verwiesen auf die entspre- 
chenden Verzeichnisse der Homepage http://www.regesta-imperii.de/ (letzte Einsichtnahme am 
10.04.2006). 
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schließung der zeitgleich im Entstehen begriffenen großen Reihen der Mo- 
numenta Germaniae Historica — insbesondere der einschlägigen Urkunden- 
reihe der Diplomata - vor: Vorarbeit und Hilfsmittel zugleich für die dann 
endgültigen Editionen. Schon die ersten Nachfolger Böhmers entwickelten 
jedoch dieses karge Konzept weiter, hin zu dem, wie wir es heute kennen: 
Ein Regest soll demnach eine möglichst exakte Wiedergabe des Rechtsin- 
halts von Urkunden, deren formale Beschreibung, die kritische Einordnung 
der historiographischen Nachrichten bieten, alles streng orientiert an der 
Chronologie. Dieses Konzept hat sich über Generationen von Forschern 
hinweg bewährt und wird — ohne jemals verbindlich für alle Unterneh- 
mungen festgelegt worden zu sein - fortgeführt werden, auch im digitalen 
Zeitalter. 

Natürlich kommen heutige, neuere Regesten schon allein optisch in an- 
derem Gewand daher als ältere. Das springt in den gedruckten Versionen 
geradezu ins Auge, in der digitalen aber erst auf den zweiten Blick. Und 
genau hier wollen wir einhaken und mit durchaus selbstkritischem Unter- 
ton die Frage stellen: 

Was mag angesichts einer fast 180 Jahre währenden, viele tausende ge- 
druckte Seiten umfassenden Publikationsstrecke nun verborgen, gar ver- 
gessen sein oder muß letztlich sogar als verloren gelten? Und was kann 
diese Fragestellung vor dem Hintergrund unserer Tagungsproblematik 
leisten? Es geht also hier nicht so sehr darum, das bisher digital Erreichte 
zu präsentieren, hier mag sich jeder einen schnellen Überblick mit einem 
Klick auf unsere Homepage verschaffen, sondern vielmehr die durch die 
digitale Version sich ergebenden Möglichkeiten und Erweiterbarkeiten zu 
beschreiben und auch die sich daraus ergebenden Probleme in der digita- 
len Werkstatt anzureißen. 

Wir wollen uns von zwei Seiten nähern, von innen nach außen vorge- 
hend. Am Ende mag dann das eine oder andere Fragezeichen wegfallen, 
vielleicht kommen aber auch durch die sich hoffentlich entzündende Dis- 
kussion neue hinzu! 
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idR, s Toat Y ENTER 
Dr. Johann Friedrich Böhmer, 


Pa AO AN u Doll hi WR 
glied der Gesellschaft” für ältere deutsche Geschiehtskunde, 


Abbildung 1: Titelblatt des „Ur-Böhmer“. 
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Bei aller Konzeptionsstabilität ist zunächst einmal festzuhalten, dass das 
durch die Regesta Imperii in ihren vierzehn klassischen Abteilungen - orien- 
tiert an Herrscherdynastien, späterhin auch an einzelnen Herrschern - 
dargebotene Material ein äußerst heterogenes Erscheinungsbild liefert. Ein 
knapper Überblick mag dies veranschaulichen. 

Der Ur-Böhmer, sozusagen die Vorabausgabe, die noch nicht in die klas- 
sische Zählung aufgenommen wurde, stammt aus dem Jahr 1831. In die- 
sem Band hat Böhmer das gesamte ihm durch die Quellen-Literatur be- 
kannte Material von Konrad I. bis Heinrich VII., immerhin aus einem Zeit- 
raum von 400 Jahren, gesammelt. Und: Selbst diese kargen Schnipsel sind 
noch heute, mangels bisher erfolgter Neubearbeitungen, in Teilen (zum 
Beispiel für die das 11. Jahrhundert dominierende Herrscherfamilie der Sa- 
lier) zitierfähig! 


“i i z 
« . a 
Heinrich II 1089 — 1040. (vu — vin. 73 
nn 
No. |O-/R.! 1039 (VII) G j 
mn 

12) 1|Juni 4. |Traiecti Regierungsantr dtt. Bereits am 14. April 1028 war er zu Aachen als Kö- 

p nig gesalbt worden und rechnet von da an die Jahre seiner Königsweihe. 

1445|—|—| — 22. ° |Anternacho bestätigt die Privilegien des Bisthums Minden. Schaten I, 515. Pistorius 

S. S. IIL, 822. 
1446|—|—|Juli 10: |Mogontiae bestätigt die Privilegien des Hochstifts Bamberg. Heyberger At 24 mit 
ar ` Siegel. 
a447)—|—|Sept. 3. |Goslariae Hestätige dem Abt Truchtmar die Privilegien und Besitzungen der Klöster 
t Corvei und Herford. ‘Schaten I, 516. Falke 740. 
1848 |—| — 3. — bestätigt dem Kloster Corvei freie Ahle naht Immunität, Zehntfreiheit etc. 
f Schaten I, 518. 
CE wad al | — 3. pani Schutz- ; nenne und Bestätigungsbrief für das Nunnenkloster: zu Kemi- 
i nata im Gau Tilithi. Schaten E, 519. 5 
1450|- —|—| — 3. 5 — _ | bestätigt die Privilegien und Pesitaihgen des Klosters Gandersheim. Haren- 
X berg 672. 


Abbildung 2: Regesten Heinrichs Ill. aus dem Ur-Böhmer (1831). 


Das bereits angesprochene erweiterte Regestenkonzept der Nachfolger 
Böhmers mag an einem Auszug aus den Regesta Imperii V (Jüngere Staufer), 
nach altem, an die Bearbeiternamen angelehnten Zitierstatus auch als Böh- 
mer-Ficker-Winkelmann bezeichnet, deutlich werden. 

Dieses Druckbild, charakterisiert durch die vertikalen Kolumnen von 
Datum, (Ausstellungs-)Ort und eigentlichem Regestentext, wurde gegen 
Ende des 19. Jahrhunderts gleichsam kanonisiert, alle Bände der älteren Be- 
arbeitungen sind in diesem Format erschienen. 
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aug. 22 


— 23 


— 23 


Maguntie 


An diesem tage geht der kaiser gekrönt und gibt den fürsten ein grosses fest. Ann. Col. — Impe- 
rator in octava assumptionis coronatus incessit. Ann. Marbac. Vgl. Sächs. Weltehr. c. 379. — 
Setzen Albricus und die Chr. Mettensis, M. Germ. 24,521, den hoftag überhaupt auf die octava 
assumptionis, so haben sie wohl nur diesen hauptfesttag im auge. *a 


bestätigt dem domcapitel zu Hildesheim auf bitte des bischofs Conrad von Hildesheim den 
rückkauf gewisser vogteien welche Hermann und Heinrich gebrüder von Woldenberg und andere 
von dessen kirche trugen. Harenberg Hist. Gand. 428. Huill. 4,758. 2105 


Conrad von Hohenlohe, graf der Romagna, bekundet dass er seine burg Leindal der kirche von 
Cöln aufgetragen habe und damit vom erzbischof Heinrich belehnt sei. Z.: Heinr. gr. v. Sain, 
Loth. gr. v. Hochstaden, Gerl. v. Büdingen, Hermann v. Müllenark, Alb. v. Drincht, Rosemann v. 
Kempenich, Gerl. u. Heinr. br. v. Isenburg, Gerh. vogt v. Cöln, Dietr. truchs., Goswin marschall, 
Alb. v. Hörde schenk, Winemar v. Asterlo. Hansselmann Landeshoheit 1,401. Isenburg. Ge- 
schlechtsreg. 2,45. Wirtemb. Urkkb. 8,368. *2106 


Abbildung 3: Auszug aus den RI V (Jüngere Staufer). 


Im Unterschied zum Ur-Böhmer finden sich nun längere Regestentexte, An- 
gaben von Zeugen, ein diplomatischer Apparat, Literaturangaben und 
Kommentare. Dies alles nur spärlich strukturiert, aus Sparsamkeitsgrün- 
den (Papier!) oft mit Kürzungen aller Art versehen, für den Buchnutzer ak- 
zeptabel, für die Digitalisierung, das sei vorweg festgehalten, problema- 
tisch. Beispielhaft sei hier ein Ausschnitt aus dem Register der Regesten Kai- 
ser Sigismunds (RI XI) gezeigt, der die Problematik verdeutlichen kann. 


805. 833 f. 852. 855. 861. 881 f. 
886. 919. 922. 935. 938. 3006. 
025 f. 029. 031 f£. 035. 039 ff. 045. 
047 ff. 062A. 103. 107. 114. 118. 
120. 129 f. 139f. 142. 144. 144%. 
147. 1512. 160f. 223. 243. 309. 
4412. 481 ff. 495. 599. 600 ff. 688. 
720. 737 f. 778 ff. 782. 795. 812. 
814. 944. 968. 973. 4040. 047. 049. 
155. 390 f. 398. 417 f. 443 f. 464. 
579. 636. 875. 935%. 987. 5015. 
083. 116 f. 133. 257. 266. 269. 354. 
352. 397 f. 402. 430. 454 ff. 645. 
653. 664. 680. 737. 755. 907. 909. 
983. 6001. Ol5f. 032. 118. 247. 
307. 311. 318. 320 ff. 333. 401. 
565. 711. 769. 771. 785. 810. 813 
—19. 825 ff. 933 ff. 9668. 970. 


Abbildung 4: Ausschnitt aus dem Register zu RI XI. 


Mit der in der zweiten Zeile des Beispiels genannten Regestennummer 
„3006“ beginnen die Verweise auf die 3000er-Regestennummern. Der 
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Nummer folgt aber die Zeichenfolge „025 f.“, wobei man sich die führende 
Drei hinzudenken muss! Dieser Art ergänzt würde die Reihe der Regesten- 
nummern wie folgt aussehen: 

2805. 2833 f. 2852. 2855. 2861. 2881 f. 2886. 2919. 2922. 2935. 2938. 3006. 
3025 f. 3029. 3031 f. 3035. 3039 ff. 3045. 3047 ff. 3062A. 3103. 3107. 3114. 3118. 
3120. 3129 f. 3139 f. 3142. 3144. 3144a. 3147. 3151a. 3160 f. 3223. 3243. 3309. 
3441a. 3481 ff. 3495. 3599. 3600 ff. 3688. 3720. 3737 f. 3778 ff. 3782. 3795. 
3812. 3814. 3944. 3968. 3973. 4040. 4047. 4049. 4155. 4390 f. 4398. 4417 f. 4443 
f. 4464. 4579. 4636. 4875. 4935a. 4987. 5015. 5083. 5116 f. 5133. 5257. 5266. 
5269. 5354. 5362. 5397 f. 5402. 5430. 5454 ff. 5645. 5653. 5664. 5680. 5737. 
5755. 5907. 5909. 

Ähnliche Arbeitsschritte sind bei der Ergänzung der Volltextsuche 
durch die auf die jeweiligen Regesten verweisenden Lemmata aus dem Re- 
gister notwendig, um die oben bereits angedeuteten zahlreichen Abkür- 
zungen in den Regestenbänden über die Volltextsuche zu erschließen. 

Das heutige Erscheinungsbild der Regesten kann dagegen im wesentli- 
chen erst auf eine ca. 30-jährige Geschichte zurückweisen. 

Die bis in die 1970er Jahre allein von der Österreichischen Akademie der 
Wissenschaften mit bescheidenen personellen und finanziellen Mitteln aus- 
gestatteten Regesta Imperii konnten durch die Gründung der Deutschen Re- 
gestenkommission (1968) und der bald darauf folgenden Einbindung in 
das ‚Akademienprogramm‘ von Bund und Ländern zum ersten Mal in der 
Geschichte des Gesamtunternehmens auf eine solide Basis gestellt werden. 
Die heute von den Akademien in Mainz, Berlin und Wien betriebenen Re- 
gesta Imperii verfügen über ein gutes Dutzend Personalstellen und die nöti- 
gen Sachmittel. Aufgrund dieser Fundierung konnten in den letzten Jahren 
brachliegende Forschungsfelder bearbeitet und die Publikationsfrequenz 
entscheidend erhöht werden. Besonders hingewiesen sei dabei auf die äu- 
ßerst materialreichen spätmittelalterlichen Abteilungen, denen bei Fehlen 
einschlägiger Editionen (und auch keiner Aussichten auf solche) ein eige- 
ner Darstellungswert beizumessen ist. 
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933 Februar 27 - 933 Mai 105 


933 März, Bergamo 1676 
Die notarii domnorum regum Andreas und Gumpert sind Zeuge in einer Tauschurkunde der 
(Kollegiat-)Kirche S. Alessandro in Bergamo, vertreten durch ihren Propst und Custos, den Presby- 
ter Johannes. — Leo notarius. — a. r. Hu. 7, Lo. 2, Ind. 6. 

Charta (comutacio), ed. Pergamene di Bergamo, Nr. 79 S. 128-129 (Or., vgl. die Taf. 79 im zugehörigen 
Tafelband); zuvor ed. CD Langob., Nr. 544 Sp. 929-931. 


Die Datierungsangaben führen einheitlich auf 933 März. - Zur ehemaligen Kathedralkirche S. Alessandro vor den 
Stadtmauern in Bergamo vgl. Regg. 1136, 1170 u.ö. 


933 März, villa Villiano (Vigliano) 1677 
Der Notar Ingelbert schreibt eine Verkaufsurkunde genannter Privatleute. — a. r. Hu. 7, Lo. 2, Ind. 6. 


Charta (cartula venditionis), ed. GABOTTO, Le piü antiche carte di Asti, Nr. 50 S. 87-89. 


Königsjahre und Indiktion stimmen zu 933 März überein. Bei dem Ausstellort wird es sich um Vigliano d’Asti, Prov. 
Asti, handeln. — Ingelbert (vgl. auch Reg. 1679) ist noch in den 50er Jahren in Asti bezeugt und hat nie den Titel eines 
notarius oder iudex domnorum regum geführt; vgl. das Sonderregister. — 933 (?) April wird auch in Ravenna erstmals 
nach Hugo datiert: CAVARRA, Regesto, S. 440 Nr. 124; vgl. Reg. 1835. 


Abbildung 5: Ausschnitt aus den Karolingerregesten Bd. 3,3 (2006). 


1444 Oktober 7, Nürnberg 284 


Kg. F. belehnt Franz Volckamer (Volkmayr) von Nürnberg, mit seinen Reichslehen, 
namentlich mit acht Gütlein zu Leinburg (Leymburg), einem Gütlein zu Haimendorf 
(Hemendorff) und einer Mühle bei Leinburg samt allen Rechten, Nutzen und Zubehör, 
verleiht ihm daran, was er nach Recht zu verleihen hat, jedoch unbeschadet der Rechte 
von König und Reich sowie anderer, und bestätigt, daß Franz ihm dafür den gewöhn- 
lichen Lehnseid geleistet hat. An mittichen nach sand Francziscen tag. 


KVr: A.m.d.r. Hermannus Hecht. - KVv: Francz Volkelmair (auf der Rückseite des unteren 
Pressel); Leinpurgk Heymendorff (Empfängervermerk auf der Rückseite). 


Org. im StA Nürnberg (Sign. Rst. Nürnberg, Heiliggeistspital Nürnberg, Urkunden Nr. 269), 
Perg., rotes S 11 in wachsfarbener Schüssel mit rotem S 13 rücks. eingedrückt an Ps. 


Vgl. CHMEL n. 1486 (ohne Monats- und Tagesangabe und mit Ausstellungsort Wien zu 1443 
nach RR N fol. 183°), wonach diese Lehen! dem Hans Volckamer verliehen wurden. 


! Lediglich abweichend in der Anzahl der Gütlein zu Leinburg, wo von einem Gütlein statt von acht die 


Rede ist. 


Abbildung 6: Regest aus Heft 14 der ReggFlll (insgeamt circa 9 000 Stücke 
publiziert). 
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Der gegenwärtige Publikationsstand beläuft sich auf etliche tausend Seiten 
und ca. 140 000 Regesten. 

Die Frage, wie diese beträchtliche, über Jahrhunderte angewachsene 
Masse in irgendeiner Form ‚einheitlich‘ digital zu präsentieren sei, stand 
denn auch am Anfang des vor fünf Jahren mit der Bayerischen Staatsbiblio- 
thek München begonnenen DFG-Projekts der Retrodigitalisierung der alten 
und der genuin digitalen Publikation der neueren Bände der Regesta Impe- 
rii. So waren denn am Anfang die Wünschbarkeiten auch groß: Ausgehend 
von den Erfahrungen bei der Produktion des ersten elektronisch verfügba- 
ren Regesten-Produkts, der CD-ROM mit den für Heft 1-10 kumulierten 
Regesten Kaiser Friedrichs III. (1440-1493), sollte der dort verwirklichte 
Nutzerkomfort analog auf alle anderen Teilprojekte übertragen werden. 
Doch dies erwies sich, in Anbetracht der schieren Masse und deren Hetero- 
genität und trotz des beträchtlichen finanziellen Einsatzes (OCR-Kosten), 
schon früh als illusorisch. Um wenigstens das Ziel, alle bisher publizierten 
Bände im Projektzeitraum ins Netz zu stellen, zu erreichen, wurde die Er- 
schließung, wie man es salopp sagt, flach gehalten. Volltextsuche in teilwei- 
se strukturierten Teilen der Regesten (Text, Apparat), Datumssuche und 
Verlinkung der Literaturzitate mit dem RI-OPAC: Dies war der Kompro- 
miss. 

Diese kurze Bestandsaufnahme legt schon nahe, dass mit einiger Sicher- 
heit manches an Informationen aus den gedruckten Bänden bisher digital 
noch nicht umgesetzt, also verborgen, ist. Manches war sogar, wie wir bei 
den Vorbereitungen für diese Tagung überrascht feststellen mussten, schon 
schlichtweg in Vergessenheit geraten. Der Schritt zum Verlorengehen ist da 
naturgemäß nicht mehr weit. Um was geht es konkret: 

Werfen wir zunächst einen Blick auf die immanenten Problemstellen: 

Von den 14 Abteilungen der RI werden immer noch 8 (mit wenigen Aus- 
nahmen) allein durch Publikationen der Vorkriegszeit repräsentiert, aus ei- 
ner Abteilung (IX Wenzel) ist bisher überhaupt noch nichts publiziert. 
Auch wenn gerade in den nächsten Jahren die Früchte der Neubearbeitun- 
gen reichlicher geerntet werden können, so werden wir doch auf unabseh- 
bare Zeit in vielen der älteren Publikationen den zitierfähigen Publikations- 
stand behalten. Unser besonders Augenmerk wird daher auf der besseren 
Erschließung dieses Materials liegen müssen. 
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Abb. 7: Ausschnitt aus dem Personennamenregister. 
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Folgende Informationseinheiten seien als signifikant hervorgehoben: 


— Register, 

— Verzeichnisse, 

— Konkordanzen, 

- Literaturverlinkung, 

- Vorworte/Einleitungen, 

-— Nachträge (mit Mehrfachnumerierungen). 


Die in den älteren Bänden nur kümmerlich entwickelte Textstruktur lässt 
den beigegebenen Apparaten (Verzeichnissen) einen hohen Stellenwert zu- 
kommen. Am Beispiel der schon vorhin gezeigten Auszüge aus den Stau- 
ferregesten lässt sich dies gut veranschaulichen. 

Das für diese Abteilung, wie längst nicht für alle, vorliegende Register 
enthält in beträchtlicher Zahl Metainformationen zu den Regesten (Orts 
und Personenidentifikationen), liegt aber selbst wiederum in einem für die 
digitale Aufbereitung problematischen Format vor: Kürzungen in den text- 
lichen Teilen und, weit unangenehmer, Kürzungen in den Regestennum- 
mern. Allein um hier zu einer ‚einfachen‘ Verlinkung von Regestennum- 
mern und Text-Register zu gelangen, bedarf es erheblichen Aufwandes. 
Hier wird es in absehbarer Zeit Übergangslösungen geben, derart, dass die 
Register mit dem Volltext gemeinsam durchsuchbar sein werden. 

Eine Vielzahl von Informationen ist auch in den mannigfaltigen den äl- 
teren Bänden beigegebenen Verzeichnissen und Konkordanzen verborgen. 
Besonders augenscheinlich ist das bei den Referenzierungen auf ältere Be- 
arbeitungen der Regesta-Ausgaben oder ersatzweise herangezogene Werke 
(zum Beispiel Chmels Regesta Friderici für die Regesten Friedrichs III.). 

Problematisch, gleichsam nur als Informationsbrocken, kommen die 
Quellenbelegstellen und die Literaturangaben in den älteren Bänden daher. 
Hier gibt es außer gelegentlich summarischen Übersichten in den Einlei- 
tungen keinerlei auflösende, die vollständigen bibliographischen Angaben 
enthaltende Verzeichnisse. Aus diesem Grunde haben wir in den RI-Online 
auch diesem Bereich zunächst die meiste Aufmerksamkeit gewidmet, ist 
hier doch gegenüber den gedruckten Bänden ein deutlicher Mehrwert zu 
erzielen. Dreh- und Angelpunkt ist dabei der RI-OPAC, der aufgrund seiner 
Größe und thematischen Bandbreite längst ein Eigenleben bezüglich der 
Literaturversorgung aller an mediävistischen Themen Interessierter führt. 
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Dass diese mittlerweile weltweit umfangreichste Fachbibliographie einen 
hohen Imagewert für das Gesamtunternehmen besitzt, ist ein willkomme- 
ner Nebeneffekt. Für die Binnenerschließung der Regesten dient der RI- 
OPAC insoweit, dass jedes zitierte Werk in ihm enthalten ist und über einen 
eindeutigen, unveränderlichen Kurztitel die Verlinkung gewährleistet. Für 
die Regestenbearbeiter besitzt der RI-OPAC natürlich wesentliche Synergie- 
effekte: Es gibt eine zentral geführte Datei, eindeutige bibliographische An- 
gaben, Neueingaben können künftig direkt im Netz vorgenommen wer- 
den. Mit dem RI-OPAC durchbrechen wir aber auch schon weitgehend das 
Problem des ‚Vergessens’‘, denn in ihm sind bereits große Teile der Arbeits- 
bibliographien sämtlicher Arbeitsstellen enthalten! 

Lassen sich die inneren verborgenen Schätze bei dauerhaftem personel- 
len und sachlichen Engagement im Laufe der Zeit heben, so gibt es einen 
äußeren Bereich von einschlägigen Informationen, in dem die Chancen 
schlechter stehen. Dass wir diesen Bereich überhaupt künftig möglicher- 
weise sinnvoll einbeziehen können, verdanken wir allein den digitalen 
Möglichkeiten. Gemeint sind hier Informationen, die sich in welcher Hin- 
sicht auch immer auf die Regesten beziehen, seien es Corrigenda, Zusätze 
im Text, im Apparat, in den Literaturangaben, in der kritischen Bewertung 
der Historiographie, in der diplomatischen Qualität der Urkunden (Fäl- 
schungen), Informationen, die an ganz unterschiedlichen Stellen (ich beto- 
ne: noch) vorhanden sein können. Zunächst ist dabei natürlich an die Urhe- 
ber der Regesten, die Autoren und Herausgeber, zu denken, die - sofern sie 
ihrem Sujet verbunden geblieben sind respektive bleiben - mit einer gewis- 
sen Systematik dieses ergänzende Material sammeln. Ferner kann man an 
Forscher denken, die aus eigenem Forschungsinteresse das Regesten-Mate- 
rial als Grundlage genommen und im Laufe der Zeit weiterverarbeitet ha- 
ben (das können durchschossene Exemplare wie das in unseren Fachkrei- 
sen bekannte Exemplar der RI VIII des Giessener Mediävisten Peter Moraw 
sein, natürlich auch Karteien oder Dateien an den verschiedensten Orten). 
Des Weiteren ist an Korrespondenzen zwischen Bearbeitern und Rezipien- 
ten, Gutachtern und so weiter zu denken und schließlich an die nun digita- 
len Möglichkeiten, Verbesserungen und Kritik online anzubringen. 

Angesichts der fast zwei Jahrhunderte umfassenden Publikationszeit 
muss man realistischerweise von etlichen Informationsverlusten ausgehen, 
denn: Weder gab es bis in die neuere Zeit eine nennenswerte Archivierung 
von Arbeitsmaterialien, noch Mittel und Möglichkeiten, etwa zufällig anfal- 
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lendes Material zu publizieren. Als besonders nachteilig wirkt sich hier die 
Organisationsstruktur der Regesta Imperii aus: im Gegensatz etwa zur MGH 
handelt es sich bei den RI nicht um ein auf Dauerbetrieb angelegtes Insti- 
tut, sondern um einen Verein, dessen Projekte auf Endlichkeit angelegt sind 
und die von einer einzigen Personalstelle aus koordiniert werden. Die 
Wahrnehmung in der Öffentlichkeit ist naturgemäß eine andere und so ist 
es kein Zufall, dass auch die RI (respektive ihre Geschäftsstelle und Einzel- 
unternehmungen) Materialien der oben angegebenen Art erhalten und so 
gut es geht sammeln. Als ein besonders gelungenes Beispiel für die Rettung 
und Nutzung von Vorarbeiten sei das Projekt der Regesten Kaiser Ludwigs 
des Bayern erwähnt, dass sich auf den im Münchner Hauptstaatsarchiv 
verwahrten Nachlass von Friedrich Bock stützen kann. 


ur 


pma - i 1398 Januar Y Frankfurt 


König Wenzel für Rens,bestätigt das den Einwohnern des Dorfes 
von Kaiser Karl IV.1376 Juli 9 zu Aachen erteilte Privileg,das 
im Wortlaut inseriert ist,in dem Garten,in dem die Reichsfür- 
sten die Königswahl vornehmen,den Königsstuhl zu errichten 


0 StA Düsseldorf Kurköln 1286 


ir Wentzlaw von gots gnaden Romischer kunig zu allen zeiten merer des 
Reichs vnd kunig zu Beheim Bekennen vnd tun kunt offenlichen mit diessem 
briue allen den die yn sehen oder horen lesen daz wir vur vns kumen sein di 
e Insezzen Burger vnd Inwoner des dorffs zu Rense vnsere vnd des Reichs lie 
s ben getrewen vnd baten vns demuticlichen daz wir yn eynen brieff den sie ha 

ben van dem Allerdurchluchtigisten fursten vnserm lieben herren vnd vater 
seliger gedechtnüsse etwenn Romischen keyser gnediclichen geruhten zu Con- 
firmiren der van worte zu worte also lautet 

Wir Karl van gots gnaden Romischer keyser zu allen zeiten merer 

des Reichs vnd kunig zu Beheim Bekennen vnd tun kunt offentli- 

chen mit diesem briue alien den die yn ansehen oder horen lesen 

daz wir mit Rate der kurfursten dez Reichs mit den Insezzen Bur 

gern vnd Inwonern des dorffes zu Rense vnsern vnd des Reichs 

lieben getrewen bestellet vnd geschaffet haben daz sie in dem 


Abbildung 8: Transkription aus dem Nachlass Hanisch. 


Ein weiterer interessanter Nachlass wird seit 20 Jahren in der Mainzer Ge- 
schäftsstelle der Regestenkommission verwahrt: die Sammlung Hanisch. 
Hierbei handelt es sich um die von dem ehemaligen Vechtaer Universitäts- 
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bibliothekar Wilhelm Hanisch privat und auf eigene Kosten betriebenen, 
durchaus auf eine Regestenpublikation abzielende Sammlung von urkund- 
lichen Belegen zu Wenzel von Böhmen (1379-1400/10). Ohne auf die verwi- 
ckelte Geschichte dieser Sammlung, zu der man auch diejenige einer ähnli- 
chen, von Ivan Hlaväcek in Prag aufgebauten, zählen müsste, im Einzelnen 
eingehen zu wollen: Wilhelm Hanisch hat im Laufe von 40 Jahren akribisch 
die europäischen Archive nach Wenzeliana abgesucht und in Wort und 
Bild circa 5 000 Stücke eruiert. 


1398 Dezember 28 Prag 
(am der kindlein tage) 


König Wenzel schreibt Bürgermeister,Rat und Bürgerschaft der Stadt Frankfurt, 
l)dass er ihre Botschaft wegen seiner Pfandschaft erhalben habe und gebietet, 
dieselbe unverändert zu lassen,2)Nit Graf Gunther von Schwarzburg werde er 
selbst wegen der Steuer verhandeln,wenn dieser bei ihn ist 


ad relacionem Borziwogii de Swinar Franciscus canonicus Pragensi 


0 SA Frankfurt Reichssachen I 567.Papier 
Rotes Verschlussiegel ab 


Abbildung 9: Karteikarte aus dem Zettelkasten der Sammlung Hanisch. 


Wie bereits angedeutet, sind bisher noch keine Regesten Wenzels erschie- 
nen, die von der Österreichischen Akademie federführend betriebene Ab- 
teilung wird in nächster Zeit zwar mit der Publikation beginnen, jedoch 
aus verschiedenen Erwägungen heraus analog den Ludwig- und Friedrich- 
Regesten nach dem Provenienzprinzip. Noch auf lange Zeit wird also die 
Hanisch-Sammlung wertvoll bleiben. Daher planen wir nun im Rahmen 
der RI-Online eine digitale Publikation des Materials. 

Es handelt sich in erster Linie um eine auf der Grundlage der Arbeits- 
karteien erstellten chronologischen Datei der Urkunden Wenzels. Diese 
wurde Ende der 1980er Jahre in einem heute obskur anmutenden Pro- 
gramm namens ‚AskSam‘ erfasst, dass nun wiederum migriert werden 
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muss. Ergänzend zu dieser Datenbank treten zu jedem Stück die Fotos der 
Urkunden (die als Negativ, Diapositiv, Abzug vorliegen) sowie die maschi- 
nenschriftlichen Abschriften der Stücke. Zu denken ist auch an eine Publi- 
kation der umfangreichen Archivkorrespondenz sowie weiterer Hilfsmate- 
rialien (zum Beispiel eine umfangreiche Orts- und Personenkartei). 


Abbildung 10: Abbildung einer Wenzelurkunde aus dem Nachlass Hanisch. 


Da weder die personelle noch die finanzielle Ausstattung der Regesten- 
kommission Mainz für eine normale Publikation ausreichen, werden mo- 
mentan die Möglichkeiten der Bereitstellung des Materials über das Con- 
tent-Managment-System (CMS) Typo3 getestet. Als Vorteile wären bei die- 
ser Publikationsart zu nennen: 


— keine Druckkosten, 
- dynamische Weiterentwicklung, 
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- Verteiltes Arbeiten ist möglich, 

— für die Bearbeitung des Corpus sind keine speziellen EDV- oder HTML- 
Kenntnisse nötig, 

- die Publikation wächst ständig, alle Änderungen und Ergänzungen sind 
sofort im Netz sichtbar. 


Einige dieser Punkte machen Typo3 auch für die Ausgestaltung der Home- 
page der Regestenkommission interessant. Insbesondere die Möglichkeit, 
einzelne Abschnitte des Seitenbaumes nur bestimmten Nutzergruppen zur 
Bearbeitung zu überlassen, ermöglichen es interessierten Projekten, selbst 
über die Inhalte der sie betreffenden Seiten zu entscheiden, ja diese auch 
selbst zu gestalten. Dies führt im Idealfall nicht nur zu umfassenderen, son- 
dern auch zu einer aktuelleren Seitengestaltung. Neben einer gegebenen- 
falls notwendigen Schulung der Mitarbeiter steht der Seitenneugestaltung 
ansonsten nichts im Wege. 

Mit diesem Ausblick auf die aktuellen Schwerpunkte unseres Digitali- 
sierungsvorhabens möchten wir schließen, nicht ohne die Hoffnung, Ihnen 
einen erhellenden Einblick in das ‚dunkle‘ Mittelalter respektive in die Er- 
forschung der Grundlagen desselben gegeben zu haben. 


Virtuelle Zusammenführung und inhaltlich-statistische 
Analyse der überlieferten Reichskammergerichtsprozesse 


Bernd Schildt 


Die archivalische Hinterlassenschaft des Reichskammergerichts ist gekenn- 
zeichnet durch eine überaus disparate Quellenüberlieferung. So finden sich 
Verfahrensakten des Reichskammergerichts nicht nur in zahlreichen deut- 
schen, sondern auch in einer ganzen Reihe ausländischer Archive, so zum 
Beispiel in Frankreich,' Polen,’ den Niederlanden,’ Belgien* und Österreich. 

In den Jahren 1847-1852 wurden circa 70 000 Prozessakten des 1806 
ohne ein vergleichbares Nachfolgegericht untergegangenen Reichskammer- 
gerichts unter die Mitglieder des Deutschen Bundes verteilt. Diese Zersplitte- 
rung wurde nach 1852 in einer Reihe von Bundesgliedern durch weitere 
Aufteilungen noch fortgesetzt.° An eine systematische Erforschung der Tä- 
tigkeit des Reichskammergerichts war infolge dieser Aufteilung der Pro- 
zessakten auf mehr als 40 in- und ausländische Archive lange Zeit kaum zu 
denken. Mittlerweile ist die Neuverzeichnung der Prozessakten nach den so 
genannten DFG-Richtlinien’ in den meisten deutschen Verwahrarchiven so 


! Im Departementalarchiv Straßburg für die Landgrafschaft Elsaß, das Herzogtum Lothringen 
und weitere angrenzende ehemalige Reichsstände, im Departementalarchiv Metz für das Her- 
zogtum Lothringen sowie im Stadtarchiv Straßburg für die Reichsstadt Straßburg und im Depar- 
tementalarchiv Besancon für Stadt und Erzbistum Besancon. 


? Im Wojewodschaftsarchiv Stettin für das Herzogtum Pommern. 

° Im Reichsarchiv Limburg (Maastricht) für das Königreich der Niederlande. 

* Im Staatsarchiv Lüttich für das Königreich Belgien. 

° Im Haus-, Hof- und Staatsarchiv Wien für das Erzbistum Salzburg sowie die Fürstbistümer Tri- 
ent und Brixen. 

é Vgl. Walter Latzke: Das Archiv des Reichskammergerichts. In: Zeitschrift der Savigny-Stiftung 
für Rechtsgeschichte. Germanistische Abteilung 78 (1961). S. 321-326. 

7 Die Grundsätze für die Verzeichnung von Reichskammergerichtsakten sind abgedruckt in: Martin 
Ewald: Inventarisierung von norddeutschen Beständen des Reichskammergerichts. In: Der Ar- 
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weit vorangeschritten, dass eine wesentliche Verbesserung der Forschungsla- 
ge eingetreten ist.’ 

Das Projekt zur Erfassung des überlieferten Prozessmaterials des Reichs- 
kammergerichts in einer Datenbank ist angesiedelt an der Schnittstelle archi- 
valischer Aufbereitung und Sicherung historischer Massendaten — der Wis- 
sensbestände - und deren systematischer inhaltlicher Erschließung und 
Analyse auf der Basis der in den meisten Archiven bereits vorab geleisteten 
Verzeichnungsarbeiten. 

Ziel des Reichskammergerichts-Datenbankprojektes (RKG-Datenbank) ist 
die virtuelle Zusammenführung und erste inhaltliche Analyse der überlie- 
ferten Prozessakten des Reichskammergerichts. Ausgangspunkt ist eine 
weitgehend homogene archivalische Erschließung des Quellenmaterials. 
Seit 1981 sind nunmehr 25 Inventare der Akten des Reichskammergerichts ge- 
mäß den Vorgaben der genannten DFG-Richtlinien erstellt worden.’ Diese 
Inventare sind zwar weitgehend nach einheitlichen Grundsätzen erarbeitet, 
stehen aber dennoch letztlich isoliert nebeneinander.” Durch die zusätzli- 
che, methodisch neuartige Erfassung in einer relationalen Datenbank wer- 
den deutlich verbesserte Voraussetzungen für eine umfassende inhaltliche 
und räumlich wie zeitlich übergreifende Untersuchung aller in den Archiv- 
inventaren verzeichneten Reichskammergerichtsprozesse geschaffen. 

Der Wert der Datenbank ist inhaltlich natürlich abhängig von der Quali- 
tät der Inventare. Gleichwohl geht sie aber nicht nur durch ihre virtuelle 
Verknüpfung, sondern — wie noch zu zeigen sein wird — auch sachlich 
deutlich über deren Informationsgehalt hinaus. Unter Einbeziehung der be- 
reits in einer Access-Datenbank erfassten Urteilsbücher (AR 1)" wurde ent- 
sprechend den inhaltlichen Möglichkeiten, wie sie sich aus der Verzeich- 


chivar 33 (1980), Sp. 481-482, Anhang. 


® Vgl. Jürgen Weitzel: Das Inventar der Akten des Reichskammergerichts (Forschungsbericht). In: 
Zeitschrift für Neuere Rechtsgeschichte (ZNR) 21 (1999). S. 408-416. - Zuletzt Bernd Schildt: In- 
haltliche Erschließung und ideelle Zusammenführung der Prozessakten des Reichskammerge- 
richts mittels einer computergestützten Datenbank. In: ZNR 25 (2003). S. 269-290. 


° Davon sind 24 Inventare abgeschlossen. Für die Bestände in München sind bislang zwölf Bände 
erschienen. 


1 So wurden vier weitere, ältere Verzeichnungen mit insgesamt rund 10 000 Prozessen zwar nach- 
träglich in diese Reihe aufgenommen, folgen in wesentlichen Punkten aber nicht den DFG-Richtli- 
nien (Nr. 1 für die Regierungsbezirke Koblenz und Trier der preußischen Rheinprovinz, Landes- 
hauptarchiv Koblenz; Nr. 2 für die Preußische Provinz Westfalen, Staatsarchiv Münster; Nr. 3 für 
das Herzogtum Braunschweig, Staatsarchiv Wolfenbüttel; Nr. 4 für den Regierungsbezirk Stade der 
preußischen Provinz Hannover, Staatsarchiv Stade). Vgl. auch Weitzel, wie Anm. 8, passim. 
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nungstiefe der Archivinventare ergibt, und unter Nutzung der Erfahrun- 
gen älterer Versuche einer datenbankmäfßigen Erschließung” von Prozess- 
akten des Reichskammergerichts — gemäß den Möglichkeiten moderner 
Datenverarbeitung - ein mittlerweile ausgereiftes Konzept entwickelt. 

Die hier kurz beschriebene Datenbank” soll keineswegs dazu dienen, 
die gedruckten Inventare der Akten des Reichskammergerichts überflüssig 
zu machen; vielmehr ist daran gedacht, dass beide Formen der Aufberei- 
tung des Quellenmaterials einander ergänzen. Für Einzelfallprobleme, die 
sich einer formalisierenden Erfassung in der Datenbank entziehen (zum 
Beispiel Details der Sachverhaltsbeschreibungen und Beweismittel, sprach- 
liche Besonderheiten bei den Namen der Parteien oder Berufsbezeichnun- 
gen und ähnlichem), bleibt der Rückgriff auf die Inventare nach wie vor 
erforderlich und sinnvoll. Gegebenenfalls wäre daran zu denken, die Da- 
tenbank künftig mit bereits vorhandenen oder noch zu erstellenden' digi- 
talisierten Volltextversionen der Inventare der Akten des Reichskammerge- 
richts zu verlinken. Dies könnte selbstverständlich nur in einem komplexen 
Zusammenwirken mit den beteiligten Archiven erfolgen. 

Bei den Inventarisierungsarbeiten wurde mit Blick auf die nicht mehr 
als Aktenbestände vorhandenen Reichskammergerichtsverfahren in den 
einzelnen Archiven unterschiedlich verfahren. Teilweise wurden diese Pro- 
zesse mit dem Vermerk ihres Verlustes versehen aufgenommen,” teilweise 
wurde auf deren Erfassung vollständig verzichtet, so beispielsweise in 
Darmstadt, wo circa 90 Prozent des Aktenbestandes bereits im 19. Jahrhun- 
dert kassiert worden sind." Vor diesem Hintergrund werden auch die nur 


1! Hans Schenk: Reichskammergericht Bestand AR 1 Urteilsbücher, Datenbank und Begleitheft 
(Findbücher zu den Beständen des Bundesarchivs 52). Koblenz 1995. 


? Vgl. Filippo Ranieri: Recht und Gesellschaft im Zeitalter der Rezeption. Eine rechts- und sozial- 
geschichtliche Analyse der Tätigkeit des Reichskammergerichts im 16. Jahrhundert (Quellen und 
Forschungen zur Höchsten Gerichtsbarkeit im Alten Reich 17 I/II). Köln, Wien 1985. 


® Vgl. Im Einzelnen Schildt, wie Anm. 8, passim. Zum jeweils aktuellen Verzeichnungsstand vgl. 
Adresse: http://www.ruhr-uni-bochum.de/rkg-forschung/. 


4 Das dürfte für eine ganze Reihe von Inventaren mit einer beträchtlichen Zahl von Prozessen er- 
forderlich sein. 


5 Im Bremer und Frankfurter Inventar werden diese Verfahren zum Beispiel kursiv gesetzt, in 
München sind sie mit dem Hinweis „Akt makul.” versehen. 


'% Andrea Korte-Böger und Cornelia Rösner-Hausmann: Reichskammergerichtsakten im Hessi- 
schen Staatsarchiv Darmstadt und im Gräflich Solmsischen Archiv in Laubach (Repertorien des 
Hessischen Staatsarchivs Darmstadt 31, Inventar der Akten des Reichskammergerichts 15). 
Darmstadt 1990. S. IX. 
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nach dem Wetzlarer Generalrepertorium oder anderen Findhilfsmitteln er- 
schließbaren Verfahren, die aus unterschiedlichsten Gründen aktenmäßig 
nicht mehr überliefert sind, in der Datenbank erfasst. Soweit diese Prozesse 
in den Inventaren nicht oder nur unvollständig verzeichnet wurden, müs- 
sen die erforderlichen Informationen anhand der entsprechenden Spezial- 
repertorien ermittelt werden. Insoweit geht die RKG-Datenbank auch quan- 
titativ über die Archivinventare hinaus. Die auf diese Weise erfassbaren 
Angaben sind zwar gegenüber den nach DFG-Richtlinien vollständig in- 
ventarisierten Aktenbeständen inhaltlich verkürzt, können aber separat ab- 
gefragt werden. Damit lassen sich inhaltliche Fehlinterpretationen statisti- 
scher Art vermeiden. 

Gemäß den DFG-Richtlinien sollen den einzelnen Inventaren umfang- 
reiche Indizes beigefügt werden. Es handelt sich dabei um einen kombi- 
nierten Personen- und Ortsindex, um einen Sachindex, ein Verzeichnis der 
Prokuratoren, ein chronologisches Verzeichnis der Prozesse und ein Ver- 
zeichnis der Vorinstanzen und Juristenfakultäten. Diese für die Benutzung 
der Inventarbände überaus wichtigen Indizes weisen in ihrer Qualität in- 
des deutliche Unterschiede auf.” Fraglich ist ferner, ob es jemals — wie vor- 
gesehen - zur Erstellung eines Gesamtindexes kommen wird. Da dies aber 
auf jeden Fall erst nach Abschluß der Inventarisierungsarbeiten erfolgen 
kann, wird es noch geraume Zeit an übergreifenden, die einzelnen Archi- 
vinventare im Zusammenhang erschließenden Indizes fehlen.” 

Durch die RKG-Datenbank werden bis auf den Sachindex aber alle Indi- 
zes für die bislang erfassten Bestände bereits jetzt zur Verfügung gestellt. 
So werden Personen und Orte durch die Abfragen ‚Name der Parteien‘ 
bzw. ‚Sitz der Parteien‘, das Verzeichnis der Prokuratoren durch ‚Name des 
Vertreters‘ und das chronologische Verzeichnis der Prozesse durch ‚Beginn 
des Verfahrens’ bzw. ‚Ende des Verfahrens’ erschlossen. Das Verzeichnis 
der Vorinstanzen und Juristenfakultäten kann in den Feldern ‚Name des 
Gerichts‘ bzw. ‚Beweismittel‘ und ‚Beweismittel/Erläuterung‘ jeweils sepa- 
rat abgefragt werden.” 


Y Vgl. Weitzel, wie Anm. 8, S. 410. 


!8 Für den größten Bestand an Reichskammergerichtsprozessakten im Hauptstaatsarchiv Mün- 
chen (circa 14 000 Verfahren) ist nach gegenwärtigem Stand mit einer vollständigen Publizierung 
des Inventars erst in etwa 15 bis 20 Jahren zu rechnen. 


® Vgl. im Einzelnen Anlage 4: Suchmaske. 
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Die spätere Einfügung oder auch nur Verlinkung eines noch zu erarbei- 
tenden umfassenden Sachindexes ist bei entsprechender Absprache und 
Koordinierung mit den Archiven unproblematisch möglich. Denkbar wäre 
auch eine sukzessive Einarbeitung anhand der vorhandenen Indizes; dies 
bedürfte aber wohl noch grundsätzlicher Überlegungen, vor allem unter 
dem Gesichtspunkt von Aufwand und Nutzen. 

Die Sachverhaltsbeschreibungen sowie die Angaben zu den Beweismit- 
teln in den Volltextversionen der Inventare lassen sich mit den in der Da- 
tenbank verwendeten Kategorien strukturell nicht vergleichen. Während 
bei den Inventaren eher der Einzelfall in den Blick genommen wird, ist die 
Datenbankerfassung vornehmlich der Herstellung der Vergleichbarkeit 
möglichst vieler — im Idealfall aller - Einzelfälle verpflichtet. Daraus erge- 
ben sich zwangsläufig Konsequenzen für die Nutzungsmöglichkeiten. 

Die vom Wortlaut der Texte ausgehenden Indizes und auch der vorgese- 
hene Generalindex ermöglichen lediglich den Zugriff auf einzelne Verfah- 
ren anhand bestimmter Begrifflichkeiten. Auch die in digitalisierter Form 
vorliegenden Inventare lassen nur eine Suche anhand des dort jeweils ver- 
wendeten Vokabulars zu. Demgegenüber besteht der Vorteil der Daten- 
bank darin, dass sie den unterschiedlichen Sprachgebrauch in den Inventa- 
ren, und zwar in allen, insofern vereinheitlicht, als sie vergleichbare, 
überwiegend, aber nicht nur, rechtshistorische Sachverhalte und Termini in 
formalisierter Form erfasst und dadurch auch erst sinnvoll abfragefähig 
macht.” 

So werden aus den Sachverhaltsbeschreibungen der Archivinventare 
und den Darin-Vermerken nach einheitlichen, formalisierten Kriterien de- 
taillierte Angaben zum juristischen Inhalt der Prozesse, zu den Beweismit- 
teln, den verschiedenen Prozessformen und ähnlichem erfasst. Dies ermög- 
licht eine statistisch relevante, sachliche Erschließung unter allgemeinen 
und speziell rechtshistorischen Gesichtspunkten und dann - in einem zwei- 
ten Schritt — den zielsicheren Zugriff auf spezifische Einzelprobleme. Es 
ergeben sich damit ganz neue Möglichkeiten für die Erschließung des über- 
lieferten Quellenmaterials unter inhalts- bzw. sachbezogenen Kriterien. 
Vergleichbares, das in den Inventaren unterschiedlich umschrieben wird, 
kann einheitlich erfasst und folglich vom Nutzer später auch abgefragt 


2 Vgl. zu dieser Problematik auch Gert Polster: Die elektronische Erfassung des Wolfschen Re- 
pertoriums zu den Prozessakten des Reichshofrates im Wiener Haus-, Hof- und Staatsarchiv. In: 
Mitteilungen des Österreichischen Staatsarchivs 51 (2004). S. 635-649. S. 644. 
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werden.” Angesichts dieses - was die archivalische Quellenaufbereitung 
anbelangt - insgesamt erfreulichen Befundes, besteht inzwischen die Mög- 
lichkeit, diese Quellen nunmehr auch als Grundlage für konkrete For- 
schungen über den Einzelfall oder Fallstudien hinaus zu nutzen. 

Ein weiterer Vorteil der Datenbank besteht darin, dass sie die Vorausset- 
zungen von quantitativen Analysen ganz erheblich verbessert, da sie die 
Recherche unter verschiedenen Gesichtspunkten gleichzeitig ermöglicht. 
Die Datenbank gestattet die Abfrage nach 38 Kriterien, die frei miteinander 
kombiniert werden können.” Damit wird ein zielgenauer Zugriff nicht nur 
unter sachlichen, sondern auch unter personellen, räumlichen, strukturel- 
len (zum Beispiel Gerichte, Vorinstanzen) und zeitlichen Gesichtspunkten 
möglich. 

Neben diesen komplexen Abfragemöglichkeiten anhand der 38 Aus- 
wahlkriterien ist die Datenbank - entsprechend den Bedürfnissen spezieller 
Forschungsinteressen - prinzipiell auch offen für weitergehende Abfragen. 
Für die nicht formalisierbaren Individualeingaben erfolgt dies nach dem 
bekannten Prinzip der ‚Fernglassuche‘, innerhalb der selbstergänzenden 
Kombinationsfelder kann mittels der *Sternchensuche* recherchiert wer- 
den. Über diese Einzelabfragen hinaus ist auch die Schaffung neuer kom- 
plexer Abfragen grundsätzlich denkbar. 

Prinzipiell hängt der statistische Wert von Datenbankabfragen selbstver- 
ständlich maßgeblich von der Anzahl der eingearbeiteten Prozesse ab. Die 
Angaben zu abgeschlossenen Inventaren haben aber, bezogen auf deren 
Zuständigkeitsbereich, eine eigenständige Bedeutung. Sie reicht teilweise 
auch über den Zuständigkeitsbereich einzelner Inventare hinaus.” Die 
Form der Erfassung in einer Datenbank macht es also möglich, bereits auf 
der Grundlage einzelner Inventare, deren Erfassung abgeschlossen ist, spe- 
zielle Untersuchungen durchzuführen, da es sich bei diesen Daten um die 
geschlossene Überlieferung eines exakt bestimmten politisch-territorialen 


*! Damit geht die RKG-Datenbank deutlich über die digitale Fassung des Wolf’schen Repertori- 
ums (vgl. Anm. 20) hinaus. 


2 Vgl. im Einzelnen Anlage 4: Suchmaske. 


3 So wird insbesondere mit der vollständigen Erfassung des württembergischen und bayeri- 
schen Bestandes eine erhebliche Vermehrung der Prozesse reichsstädtischer Provenienz verbun- 
den sein. Vgl. dazu die Übersicht bei Kathrin Dirr und Torsten Joecker: Die Inanspruchnahme 
des Reichskammergerichts durch die Reichsstädte. In: Prozesspraxis im Alten Reich. Annähe- 
rungen — Fallstudien — Statistiken. Hg. von Anette Baumann und anderen (Quellen und For- 
schungen zur Höchsten Gerichtsbarkeit im Alten Reich 50). Köln, Weimar, Wien 2005. S. 119-136. 
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bzw. räumlich-administrativen Bereiches handelt. Insoweit haben diese 
Teilergebnisse des Datenbankprojekts durchaus einen unmittelbaren Eigen- 
wert für entsprechende Forschungsvorhaben.” 

Dass die RKG-Datenbank kein Selbstzweck ist, lässt sich anhand erster 
Ergebnisse mittlerweile verifizieren. Neben der in hohem Maße ‚nur‘ for- 
schungsvorbereitenden Funktion des Datenbankprojekts wurden und wer- 
den, verbunden mit intensiven archivalischen Forschungen, zunehmend 
auch inhaltliche Ergebnisse erbracht. Das hängt eng mit dem personellen 
Konzept des Gesamtprojekts zusammen. 

Die sehr personalintensiven Arbeiten bei der Eingabe der Daten in die 
Datenbank werden von speziell geschultem Personal — Rechtsreferendaren 
bzw. Volljuristen — geleistet. Deren Motivation wird durch die Möglichkeit 
zur Promotion entscheidend gefördert. Selbstverständlich stehen die jewei- 
ligen Dissertationsthemen regelmäßig in engem Zusammenhang mit dem 
vom betreffenden Mitarbeiter bearbeiteten Inventar. Grundsätzlich erfolgt 
bei diesen Arbeiten neben einer quantitativen Analyse des bearbeiteten In- 
ventars anhand der Datenbank zwingend die Bearbeitung eines weithin 
frei wählbaren rechtshistorischen Sachthemas, das auf der Basis archivali- 
scher Quellenstudien zu bearbeiten ist. Auf diese Weise sind inzwischen 
unmittelbar aus dem Projekt drei Dissertationen hervorgegangen. 

Mittlerweile veröffentlicht sind die beiden Arbeiten von Anna-Maria Sa- 
velsberg zur Pfändungskonstitution der Reichskammergerichtsordung von 
1555” und von Kathrin Dirr-Jansen zu hoheitsrechtlichen Streitigkeiten der 
Kölner Erzbischöfe mit der Stadt Köln.” Quellengrundlage sind die überlie- 
ferten Verfahrensakten des Reichskammergerichts im Staatsarchiv Darm- 
stadt bzw. im Stadtarchiv Köln. Im Erscheinen begriffen ist die Arbeit von 


%* Welche Möglichkeiten derartige Teilergebnisse für die Untersuchung spezieller Fragestellun- 
gen bieten, zeigen die bereits vollständig in der Datenbank erfassten Inventare. Vgl. zum Beispiel 
Kathrin Dirr: Die Bedeutung limitierter Reichskammergerichtsprivilegien der Reichsstadt Köln 
für die Entwicklung der städtischen Gerichtsverfassung. In: Zeitenblicke, 3 (2004). Nr. 3 vom 
13.12.2004, Adresse: http://www.zeitenblicke.de/2004/03/schildt/index.html#headline_quote (letz- 
te Einsichtnahme am 04.05.2006). - Torsten Joecker: Reichsstädte als Sitz des Reichskammerge- 
richts. In: Ebd. - Bernd Schildt: Datenbank Reichskammergerichtsakten. In: Ebd. 


3 Anna-Maria Savelsberg: Die Pfändungskonstitution der RKGO 1555, Teil 2 Tit. 22 als ein lan- 
desherrliches Mittel zum Ausbau der Territorialstaatlichkeit. München 2004. 


° Kathrin Dirr: Hoheitsrechtliche Streitigkeiten zwischen den Kölner Erzbischöfen und der Stadt 
Köln auf Grundlage reichskammergerichtlicher Verfahren des 16. und 17. Jahrhunderts (Rechts- 
historische Reihe 313). Frankfurt am Main 2005. 
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Christian Vajen zur Problematik der rechtlichen Anerkennung reformierter 
Reichsstände vor dem Westfälischen Frieden.” 

Neben den genannten Dissertationen — weitere sind in Vorbereitung 
und stehen zum Teil kurz vor dem Abschluss - kann in diesem Zusam- 
menhang auch auf die monographische Abhandlung des Autors zur Ent- 
wicklung der Zuständigkeit des Reichskammergerichts (2006)” und den 
Aufsatz von Kathrin Dirr und Torsten Joecker zur Inanspruchnahme des 
Reichskammergerichts durch die Reichsstädte” verwiesen werden. 

Naturgemäß sind Datenbanken sehr viel flexibler handhabbar als ge- 
druckte Bestandsverzeichnisse oder Inventare. Die Aufnahme neuerer For- 
schungsergebnisse ist jederzeit und unproblematisch möglich. Dem trägt 
auch die RKG-Datenbank durch eine besondere Rubrik — ‚Verweise‘” — Rech- 
nung, in der - soweit ersichtlich -— Querverbindungen zwischen den einzel- 
nen Verfahren kenntlich gemacht werden, auf verwandtschaftliche Bezie- 
hungen zwischen den Beteiligten hingewiesen wird und vor allem Litera- 
turangaben zu einzelnen Prozessen eingearbeitet werden. Insbesondere die 
in den Archivinventaren nachgewiesene Literatur ist bereits komplett 
verarbeitet worden. In einer späteren Bearbeitungsphase ist vorgesehen, 
systematisch nach einschlägiger - auch zeitgenössischer — Literatur zu den 
einzelnen Fällen zu suchen (zum Beispiel in den Wetzlarer Nebenstunden?”"). 
Ferner wird zurzeit daran gearbeitet, die jüngst erschienenen gedruckten 
Relationen und Voten des Reichskammergerichts vom 16. bis 18. Jahrhun- 
dert in die Datenbank zu integrieren.” Selbstverständlich kann auch auf 


” Christian Vajen: Die rechtliche Anerkennung reformierter Reichsstände durch den Religions- 
frieden vor Abschluß des Westfälischen Friedensvertrages — Eine Darstellung auf der Basis lippi- 
scher Reichskammergerichtsprozesse (Bochumer Forschungen zur Rechtsgeschichte 1). Aachen 
2006. 


2 Bernd Schildt: Die Entwicklung der Zuständigkeit des Reichskammergerichts. Von der Kayser- 
lichen Cammer=Gerichts=Ordnung Anno 1495 zum Concept der Cammer=Gerichts=Ordnung 
vom Jahr 1613 (Schriftenreihe der Gesellschaft für Reichskammergerichtsforschung 32). Wetzlar 
2006. 


? Vgl. Anm. 23. 
% Vgl. im Einzelnen Anlage 4: Suchmaske. 


91 Wetzlarische Nebenstunden. Worinnen auserlesene beym höchstpreißlichen Cammergericht entschiede- 
ne Rechts-Händel zur Erweiter- und Erläuterung der teutschen in Gerichten üblichen Rechts-Gelehrsam- 
keit angewendet werden. Hg. von Johann Ulrich von Cramer, 128 Teile (1755-1773). 


%2 Anette Baumann: Gedruckte Relationen und Voten des Reichskammergerichts vom 16. bis 18. 
Jahrhundert. Ein Findbuch (Quellen und Forschungen zur Höchsten Gerichtsbarkeit im Alten 
Reich 48). Köln, Weimar, Wien 2004. 
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Zusammenhänge zu Parteiakten oder anderen Quellen hingewiesen wer- 
den. Insoweit ist es möglich, sukzessive neuere Forschungsergebnisse re- 
gelmäßig in der Datenbank ‚nachzutragen‘. 

Die RKG-Datenbank ist prinzipiell offen für die Einbeziehung der Pro- 
zesse des anderen obersten Reichsgerichts — des Reichshofrats (circa 
70 000 Verfahren). Allerdings sind die archivalischen Vorarbeiten für den 
Reichshofrat deutlich schlechter als für das Reichskammergericht, da bis- 
lang nur für einen Bruchteil der Prozesse — im Wesentlichen etwa die 
Hälfte der Alten Prager Akten — eine vergleichbare Verzeichnung vorliegt.” 
Schließlich wäre auch die Aufnahme der überlieferten Prozessakten des 
als Höchstgericht für die schwedischen Reichsstände tätigen Wismarer 
Tribunals in Erwägung zu ziehen. Für dessen gegenüber Reichskammer- 
gericht und Reichshofrat bei weitem geringere Überlieferung (circa 5 000 
Verfahren)” hat sich in jüngster Zeit durch das 2003 begonnene Verzeich- 
nungsprojekt der Erschließungsstand wesentlich verbessert.” Da sowohl 
die Verzeichnung der Prozesse des Reichshofrats in Wien als auch der des 
Wismarer Tribunals in mehreren norddeutschen Verwahrarchiven” in en- 
ger Anlehnung an die DFG-Richtlinien erfolgt,” kann von einem grund- 
sätzlich vergleichbaren Informationsgehalt wie bei den Inventaren des 
Reichskammergerichts ausgegangen werden.” 

Die Erfassung der Daten geht von dem Grundprinzip aus, dass die for- 
malen Daten wie etwa Parteinamen, Prokuratoren oder auch Vorinstan- 
zen, unmittelbar aus den Inventaren übernommen werden. Derartige In- 


® Nach momentanem Stand sind damit circa 3000 Reichshofratsprozesse entsprechend den 
DFG-Richtlinien inventarisiert. 


* Nach der Schätzung von Nils Jörn wären darüber hinaus 10 000 bis 12 000 Prozesse rekonstru- 
ierbar; vgl. Nils Jörn: Das Archiv des Wismarer Tribunals. In: Integration durch Recht. Das Wis- 
marer Tribunal (1653-1806). Hg. von Nils Jörn, Bernhard Diestelkamp und Kjell Äke Modeer 
(Quellen und Forschungen zur Höchsten Gerichtsbarkeit im Alten Reich 47). Köln, Weimar, 
Wien 2003. S. 329-366, S. 362. 


= Gegenwärtig sind circa 1600 Prozesse inventarisiert. 
% In den Stadtarchiven Wismar und Greifswald sowie dem Staatsarchiv Stade. 


%7 Zu den Modifizierungen bei der Verzeichnung der Prozessakten des Wismarer Tribunals vgl. 
auch Hans-Konrad Stein: Bericht über den Tribunalsbestand im Stadtarchiv Wismar und Vor- 
schläge zur Verzeichnung der Tribunalsakten. In: Integration durch Recht, wie Anm. 34, S. 567- 
570. 


8 Im Übrigen sei angemerkt, dass das bei der Reichskammergerichts-Datenbank benutzte 
Grundmodell auch für die Erfassung der Rechtsprechung territorialer Obergerichte anwendbar 
sein dürfte. 
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dividualeingaben erfolgen nur dort, wo eine Formalisierung nicht mög- 
lich oder sinnvoll ist. Sie sind per se fehleranfällig, was eine ständige, 
zeitaufwendige Kontrolle erforderlich macht. Allerdings schlägt auch hier 
der Vorteil einer Datenbank gegenüber Druckversionen durch - nämlich 
die Möglichkeit der beliebigen Veränderbarkeit, die selbstverständlich 
auch Fehlerkorrekturen einschließt. Allerdings können auch bei diesen 
formalen Daten Vereinheitlichungen sinnvoll sein. Das gilt in besonderem 
Maße für die Erfassung der Prokuratoren.” 

Demgegenüber werden insbesondere aus den Sachverhaltsbeschreibun- 
gen und den Darin-Vermerken entnommene Informationen mit vergleich- 
baren Inhalten in einem formalisierten System erfasst. Dabei gilt grundsätz- 
lich, dass so weitgehend wie möglich formalisiert wird. Dafür gibt es zwei 
Varianten: Erstens und hauptsächlich erfolgt die Dateneingabe anhand vor- 
formulierter aber jederzeit veränderbarer mehrstufigerAuswahllisten, bei 
denen eine hohe Fehlerresistenz besteht. Diese Auswahllisten sind nach 
dem Prinzip der Differenzierung in ‚Allgemeines‘ und ‚Besonderes‘ aufge- 
baut, wobei bei Abfragen der betreffende allgemeine Oberbegriff die Sum- 
me der besonderen Unterbegriffe jeweils einschließt.” 

Zweitens werden bei der Dateneingabe auch sich selbst ergänzende 
Kombinationsfelder verwendet. Da diese Felder Schreibfehler tolerieren, 
erfordern sie einen erheblichen Kontrollaufwand und verursachen damit 
eine entsprechende Nacharbeit. 

Nach gegenwärtigem Stand sind circa 25000 Verfahrensakten des 
Reichskammergerichts nach den geschilderten Kriterien in der Datenbank 
erfasst." Dabei sind zurzeit folgende Bestände vollständig in die Daten- 
bank eingegeben: 


® Die Schreibweise der Namen variiert zwischen den einzelnen Inventaren, was nicht nur die 
Abfragemöglichkeiten beträchtlich einschränkt, sondern auch erhebliche Zuordnungsprobleme 
aufwirft. 


“ Zur Systematik vgl. die Anlagen 1: Verfahrensgegenstand, 2: Beweismittel und 3: Lebensbe- 
reich. 


* Zum jeweils aktuelle Stand der Datenerfassung vgl. Adresse: http://www.ruhr-uni-bochum.de/ 
rkg-forschung/. 
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- Herzogtum Braunschweig (670 Verfahren), 

-— Herzogtum Nassau ohne das ehemalige Amt Reichelsheim in der Wet- 
terau (1912 Verfahren),” 

- Fürstentum Lippe-Detmold (829 Verfahren), 

- Fürstentum Schaumburg-Lippe bzw. die sich in hessischem Besitz be- 
findliche Grafschaft Schaumburg (241 Verfahren), 

- Grafschaft Waldeck (166 Verfahren), * 

- Großherzogtum Hessen-Darmstadt (464 Verfahren),” 

- Landgrafschaft Hessen-Homburg (102 Verfahren), 

— Herzogtümer Holstein und Lauenburg (611 Verfahren), ” 

- Prozesse von außerhalb des Deutschen Bundes gelegenen Parteien und 
Prozesse zwischen den Souveränen (628 Verfahren).” 


#2 Walter Deeters: Findbuch zum Bestand Reichskammergericht und Reichshofrat 1489-1806 (Veröf- 
fentlichungen der Niedersächsischen Archivverwaltung. Inventare und kleinere Schriften des 
Staatsarchivs in Wolfenbüttel 2, Inventar der Akten des Reichskammergerichts 3). Göttingen 1981. 


® Claudia Helm und Jost Hausmann: Repertorien des Hessischen Hauptstaatsarchivs Wiesba- 
den. Abteilung 1. Reichskammergericht 1. Nassauische Prozessakten, 3 Bde., Bd. 1 A-M, Bd. 2 N- 
Z, Bd. 3 Anhang, Indices (Veröffentlichungen der Historischen Kommission für Nassau 43, In- 
ventar der Akten des Reichskammergerichts 12). Wiesbaden 1987. 


“ Margarete Bruckhaus und Wolfgang Bender: Inventar der Lippischen Reichskammergerichts- 
akten. 2 Teile, Teil 1: A-L, Teil 2: M-Z, Indices (Veröffentlichungen der staatlichen Archive des 
Landes Nordrhein-Westfalen, Reihe A: Inventare staatlicher Archive. Das Staatsarchiv Detmold 
und seine Bestände 2, Inventar der Akten des Reichskammergerichts 24). Detmold 1997. 


® Hans-Heinrich Ebeling: Findbuch zu den Reichskammergerichtsakten 1551-1806. Bestände L 
24 und H 24 (Veröffentlichungen der Niedersächsischen Archivverwaltung. Inventare und kleine 
Schriften des Staatsarchivs in Bückeburg 1, Inventar der Akten des Reichskammergerichts 9). 
Rinteln 1985. 


“ Andrea Korte: Bestand 140: Waldeckische Reichskammergerichtsakten (Repertorien des Hessi- 
schen Staatsarchivs Marburg, Inventar der Akten des Reichskammergerichts 6). Marburg 1983. 


Andrea Korte-Böger und Cornelia Rösner-Hausmann: Reichskammergerichtsakten, wie Anm. 
16. Darmstadt 1990. 


48 Jost Hausmann: Repertorien des Hessischen Hauptstaatsarchivs Wiesbaden. Abteilung 1 
Reichskammergericht. Prozessakten der Landgrafschaft Hessen-Homburg (Inventar der Akten 
des Reichskammergerichts 7). Wiesbaden 1984. 


® Hans-Konrad Stein-Stegemann: Findbuch der Reichskammergerichtsakten. Abt. 390 und an- 
dere. 2 Bde., Bd. 1 Titelaufnahmen, Bd. 2 Indices (Veröffentlichungen des Schleswig-Holsteini- 
schen Landesarchivs, 16 und 17, Inventar der Akten des Reichskammergerichts 10). Schleswig 
1986. 


% Ursula Hüllbusch und Hans Schenk: Findbücher zu Beständen des Bundesarchivs 46. Reichs- 
kammergericht. Bestand AR 1. Prozessakten (Inventar der Akten des Reichskammergerichts 18). 
Koblenz 1994. — Otto Koser: Repertorium der Akten des Reichskammergerichts, untrennbarer 
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Abgeschlossen ist auch die Eingabe der Prozessakten für die in separaten 
Inventaren erfassten Reichsstädte:” 


- Frankfurt am Main (1667 Verfahren), ” 

- Köln (1864 Verfahren), 

- Hamburg (1386 Verfahren),”* 

- Lübeck (775 Verfahren),” 

- Bremen (463 Verfahren), * 

- Dortmund (279 Verfahren; verwahrt im Staatsarchiv Münster), ” 
— Wetzlar (193 Verfahren).” 


Bestand, Band 1: Prozessakten aus der Schweiz, Italien, den Niederlanden und dem Baltikum, 
sowie der freiwilligen Gerichtsbarkeit (Veröffentlichungen des Gesamtvereins der deutschen Ge- 
schichts- und Altertumsvereine). Heppenheim 1933. — Ders.: Repertorium der Akten des Reichs- 
kammergerichts, untrennbarer Bestand, Band 2: Prozessakten aus dem Elsass, aus Lothringen 
und den angrenzenden ehemaligen Reichslanden (Veröffentlichungen des Gesamtvereins der 
deutschen Geschichts- und Altertumsvereine). Heppenheim 1936. 


"I Lediglich für den circa 1600 Prozesse enthaltenden Bestand der alten Reichsstadt Aachen liegt 
ein entsprechendes Inventar zurzeit noch nicht vor. 


° Inge Kaltwasser: Inventar der Akten des Reichskammergerichts 1495-1806. Frankfurter Be- 
stand (Veröffentlichungen der Frankfurter Historischen Kommission XXI, Inventar der Akten 
des Reichskammergerichts 27). Frankfurt/Main 2000. 


5 Matthias Kordes: Reichskammergericht Köln (Mitteilungen aus dem Stadtarchiv von Köln, Bd. 
1 Nr. 1-600 (A-F), Bd. 2 Nr. 601-1232 (G-M), Bd. 3 Nr. 1233-1677 (N-S), Bd. 4 Nr. 1678-1863 
(T-Z), Inventar der Akten des Reichskammergerichts 26). Köln, Weimar, Wien 1998-2002. 


>” Hans-Konrad Stein-Stegemann: Findbuch der Reichskammergerichtsakten im Staatsarchiv 
Hamburg. Teil 1 Titelaufnahmen A-H, Teil 2 Titelaufnahmen J-R, Teil 3 Titelaufnahmen S-Z, 
Nachträge, Teil 4 Indices (Veröffentlichungen aus dem Staatsarchiv der Freien und Hansestadt 
Hamburg, Bd. XII, Inventar der Akten des Reichskammergerichts 21). Hamburg 1993-1995. 


 Hans-Konrad Stein-Stegemann: Findbuch der Reichskammergerichtsakten im Archiv der Han- 
sestadt Lübeck. 2 Bde., Bd. 1 Titelaufnahmen A-R, Bd. 2 Titelaufnahmen S-Z, Indices (Veröffent- 
lichungen des Schleswig-holsteinischen Landesarchivs, Bde. 18 und 19, Inventar der Akten des 
Reichskammergerichts 13). Schleswig 1987. 


% Andreas Röpcke und Angelika Bischoff: Inventar der Bremer Reichskammergerichtsakten 
(Kleine Schriften des Staatsarchivs Bremen 22, Inventar der Akten des Reichskammergerichts 22). 
Bremen 1995. 


7 Günter Aders: Dortmunder Prozesse vor dem ehemaligen Reichskammergericht (Beiträge zur 
Geschichte Dortmunds und der Grafschaft Mark LIX. Hg. vom Historischen Verein für Dort- 
mund und die Grafschaft Mark). Dortmund 1962. 


9 Jost Hausmann: Repertorien des Hessischen Hauptstaatsarchivs Wiesbaden, Abteilung 1 
Reichskammergericht, Teil 3 Prozessakten des preußischen Kreises und der Stadt Wetzlar 
(3 Bde.), 3. Bd. Stadt Wetzlar, Indices (Inventar der Akten des Reichskammergerichts 8). Wiesba- 
den 1984-1986. 


Reichskammergerichtsprozesse 137 


Die Erfassungsarbeiten für diese Bestände erfolgte im Rahmen eines spezi- 
ellen ‚Reichsstadtprojekts‘” zum überwiegenden Teil drittmittelfinanziert 
durch die Alfred Krupp von Bohlen und Halbach-Stiftung und den Verein 
zur Förderung der Rechtswissenschaft e.V. Bochum.” Die zahlreichen, in 
verschiedenen territorialstaatlich geordneten Inventaren überlieferten Pro- 
zessakten reichsstädtischer Provenienz (etwa Augsburg und Nürnberg im 
Bayerischen Hauptstaatsarchiv München oder Ulm und Schwäbisch Hall 
im Hauptstaatsarchiv Stuttgart) werden im Zusammenhang mit der Erfas- 
sung der entsprechenden Inventare als Prozesse reichsstädtischer Herkunft 
gesondert gekennzeichnet und auf diese Weise auch einzeln als Reichsstäd- 
te abfragefähig gemacht. Damit sind nunmehr circa 7 100 Verfahren reichs- 
städtischer Provenienz in der Datenbank verfügbar. 

In jüngster Zeit wird mir zunehmend die durchaus berechtigte Frage ge- 
stellt, wann, wo und unter welchen Voraussetzungen die RKG-Datenbank all- 
gemein benutzbar sein wird. Dazu läßt sich heute und hier zunächst Folgen- 
des sagen: Zurzeit steht nur eine Access-Version der Datenbank auf CD- 
ROM zur Verfügung. Insoweit konnten bisherige Interessenten lediglich 
durch konkrete Nachfragen zu Einzelproblemen die Datenbank nutzen. 

Gegenwärtig arbeiten wir intensiv daran, im Spätsommer bzw. im 
Herbst diesen Jahres die RKG-Datenbank ins Internet zu stellen. Das wird 
notwendigerweise verbunden sein mit der gleichzeitigen Veröffentlichung 
mindestens einer Kurzanleitung für potentielle Nutzer, die in das komple- 
xe System der Datenbank und deren Möglichkeiten einführen soll. Aller- 
dings werden in diesem Jahr nur die vollständig erfassten Bestände veröf- 
fentlicht werden. Das hängt damit zusammen, dass für unvollständig in die 
Datenbank eingegebene Bestände die notwendigen Feinarbeiten und Kor- 
rekturen noch nicht geleistet werden können. 

Allerdings werden bereits im nächsten Jahr die beiden großen Bestände 
in Düsseldorf (für den Regierungsbezirk Düsseldorf der preußischen 
Rheinprovinz) und Münster (für die preußische Provinz Westfalen) mit zu- 
sammen fast 13000 Verfahren vollständig in der Datenbank erfasst und 


” Erste Ergebnisse dieses Teilprojekts haben zwei Mitarbeiter - Dr. Kathrin Dirr-Jansen und 
Torsten Joecker — auf einer Arbeitstagung der Gesellschaft für Reichskammergerichtsforschung 
vorgestellt; zur Schriftfassung dieses Beitrages vgl. Anm. 29. Ferner ist in diesem Zusammen- 
hang auch die Dissertation von Kathrin Dirr-Jansen zu nennen (wie Anm. 26). 


® Beiden Institutionen sei auch an dieser Stelle recht herzlich gedankt. 
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entsprechend bearbeitet sein. Damit würde sich Ende 2007 der für die all- 
gemeine Nutzung zugängliche Datenbestand nahezu verdoppeln. 


Anlage 1: Verfahrensgegenstand‘* 


Oberbegriffe 


1. Ehe/Familie 

2. Einwendungen/Einreden 
3. Erbrecht 

4. Feudalrecht 

5. Iniurien 

6. Konkursrecht 

7. Landfriedensbruch 

8. Personenrecht 

. Policey 

10. Recht/Gericht 

11. Sachenrecht 

12. Schuldrecht 

13. Steuern/Abgaben 

14. Stiftungsrecht 

15. Strafrechtliche Bezüge 
16. Verfahren 

17. Verfassung/Verwaltung 
18. Vergleich 


O 


Gliederungsschema (Beispiel) 


1. Ehe/Familie 

2. Ehe/Familie t Ehe 

3. Ehe/Familie t Ehe t Ehegüterrecht 

4. Ehe/Familie t Ehe t Ehegüterrecht t Ehevertrag 


° Zurzeit stehen in 18 Obergruppen insgesamt 488 einzelne Auswahlmöglichkeiten zur Verfü- 
gung. 
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Anlage 2: Beweismittel 


DNDDyHMÄHHAHHHH Hm 
DASERNNURDN 
GGG CSO G CE O EG ee: .G 


N 
Q 


me e 
RO REIN ON Ea 


. Augenschein 

KA 

. Parteienvernehmung 

. Sachverständige 

. Sachverständige t Juristenfakultät 
. Sachverständige t Schöffenstuhl 


rkunden 

Jrkunden t Abschied 

Jrkunden t Freiheitsbrief 

rkunden + Königsurkunde 

Jrkunden t Lehnsurkunde 

rkunden t Privileg 

rkunden t Rechtsquellen 

rkunden t Rechtsquellen t Dorfordnung 
rkunden t Rechtsquellen t Gerichtsordnung 
rkunden t Rechtsquellen t Landesordnung 
rkunden t Rechtsquellen t Weistum 


rkunden t Urteil 
rkunden t Vertrag/Rezess 
rkunden t Zinsregister 


. Verweis auf Acta priora 
. Zeugen 


Anlage 3: Lebensbereich 


1 


2 
3 
4 
5 
6 
7 
8 
9 


. Archivwesen 

. Armenwesen 

. Bauangelegenheiten 

. Bauerngüter/Rittergüter 
. Bergbau 

. Deutschritterorden 

. Dominikanerorden 

. Fabriken/Manufakturen 
. Familienangelegenheiten 


rkunden t Testament/Vermächtnis/Legat/Kodizill 
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10. Forstwesen 

11. Geldwesen 

12. Gemeindeangelegenheiten 
13. Genealogie 

14. Gesundheitswesen 

15. Handel und Gewerbe 

16. Handwerk 

17. Jahrmärkte 

18. Johanniterorden 

19. Juden 

20. KA 

21. Kaiser/Reichsangelegenheiten 
22. Kirchenangelegenheiten 
23. Klöster und Stifte 

24. Kreisangelegenheiten 

25. Kriminalität 

26. Kurfürsten 

27. Liegenschaftswesen 

28. Markangelegenheiten 

29. Militärwesen 

30. Mühlensachen 

31. Nur Vorakte 

32. Obrigkeit 

33. Rechnungswesen 

34. Religionsangelegenheiten/Reformation 
35. Schifffahrtswesen 

36. Schulwesen 

37. Staat/Verwaltung/Justiz 
38. Stiftungswesen 

39. unklar 

40. Vermögensangelegenheiten 
41. Wappen/Siegel 

42. Zunftwesen 
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Formular] 
fügen Format Datensätze Extras Fenster ? 
BSERYLRBF o REN Fur | 
Suche Verfahren | Zuständigkeit Verfahrensart/ Streitwert/ Instanz Verfahrensausgang/ Beweismittel | Inhalt | Beschreibung? Bemerkungen 


Sachfragen MT GR Buchstabe F GR Nummer y|% 
M Verfahrensgegenstand Ehe/Familie I Ehe I Ehegüterrecht I Witwenrecht 


Personendaten 


Kl 


Erbrecht I Erbengemeinschaft I Erbteilung Namen der Parteien Status im Verfahren 
= g 
I Verf-gegenst./ Erläuterung m =] 
V Lebensbereich Familienangelegenheiten z| T Status in der Vorinstanz =] 
I Verfahrensausgang =] I Berf =] 
W Beweismittel Urkunden I Lehnsurkunde =] F Stand E 
Urkunden I Urteil | a Sozialstatus Adel =] 
= MT Art der Vertretung 1] 
m Beweismittel/ Erläuterung Austrägalinstanz T Name des Vertreters = 
M Zuständigkeit Entfällt . I Titel des Vertreters E 
7 Veteiensot ey 7 Mensasta =] 
F Streitwert Kaiserliche Gerichte I Mehrfach [2] 
I Armenrecht Kommissare / Kommissionen I Jahr der Bevollmächtigung 
Lehnsgerichtsbarkeit 
Formale Daten Persönliche Rechtsprechung des Gorichehe mhii ortsbezogene Daten 
ee [Beaenra YES a aotunooner m = 
m 1 M RKG tar 
Hoheitsträger Weltliche Gerichtsinstanz sstädte =] 
mi | T Sitz der Parteien g 
Reichskreise (Instanzen) M Reichskreis Niedersachsen = 
m E Zeitliche Daten 
m V E W Beginn des Verfahren 1601 1700 T Verfahrensdauer 
MT Verweis =] 


M Ende des Verfahrens 1601 1900 


Datensatz: | 4 | T _> | bi lex] von 35846 Al >| 


[Art des Gerichts It. Auswahlliste, bei RKG = Entfällt | l f | Nf | 


E = >| OFARKG_ WECHSEL _|[RKG-Verfahren ... TRS 1404 


Konzepte zur Bereitstellung digitalisierter 
frühneuzeitlicher Quellen: 


Thomas Stäcker 


Die Medienkonversion des gedruckten kulturellen Erbes des deutschen 
Sprachraums in eine digitale Form gehört zu den großen Herausforderun- 
gen unserer Zeit. Kaum jemand bestreitet heute noch, dass die digitale Be- 
reitstellung unserer Kulturgüter ein wichtiger Faktor für deren Rezeption 
ist. Was nicht im Web ist, ist nicht in der Welt. Doch geht es dabei nicht nur 
um die bloße Bereitstellung. Mit der verstärkten Verlagerung auch geistes 
und kulturwissenschaftlicher Kommunikation und Publikation in das In- 
ternet bildet sich allmählich eine neue Forschungspraxis heraus. Das Inter- 
net entwickelt sich zu einem integralen Forschungsraum, der Bibliogra- 
phien, Datenbanken, Suchmaschinen und Kataloge ebenso umfasst wie 
Forschungs- bzw. Sekundärliteratur und digitalisierte Quellenwerke. Res- 
sourcen, die sich nicht in diesen Forschungsraum integrieren lassen, wer- 
den es in Zukunft schwer haben, noch wahrgenommen und wissenschaft- 
lich rezipiert zu werden. Umgekehrt verändert sich auch das kultur- und 
geisteswissenschaftliche Arbeiten und passt sich immer stärker den neuen 
Medienbedingungen an. Ein grundlegendender Wandel bahnt sich an, wie 
er heute schon vielerorts bei den Technik- und Naturwissenschaften zu 
beobachten ist: Ohne Medienbruch gelangt man von der Quelle direkt zur 
Literatur, die Literatur vernetzt sich untereinander, von der Literatur 
kommt man wiederum zu Quellenwerken. Elektronisch lesbare Kataloge 
und Bibliographien bzw. Datenbanken dienen als wissenschaftlich verläss- 
liche Drehscheiben dieser Entwicklung. 


1 Für die Druckfassung des Vortages wurden einige Angaben ergänzt und revidiert, der Vortrags- 
charakter aber im Großen und Ganzen beibehalten. 
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Unter dem Eindruck von ‚Google Print”, das viele europäische Politiker 
und Kulturverantwortliche aufschreckte, hat sich das Tempo dieser Ent- 
wicklung beschleunigt und auf nationaler wie europäischer internationaler 
Ebene diverse Initiativen ausgelöst. 

Die jetzt aufgekommene Digitalisierungseuphorie lässt indes leicht ver- 
gessen, dass das Herstellen von Digitalisaten nur die eine, mittlerweile ver- 
mutlich sogar die unproblematischste Seite der Medaille ist. Denn das 
schönste Digitalisat nutzt nichts, wenn es nicht gefunden wird. Ein zentra- 
les Nachweisinstrument fehlte jedoch bzw. blieb ein Desiderat.’ In der von 
Manfred Thaller betreuten ‚RetroEval-Studie‘* ergab sich bei den Benutzern 
ein erhebliches Informationsdefizit. Zahlreiche Befragte waren überrascht, 
wie viel schon digitalisiert ist, die wenigsten wussten, wo die für sie rele- 
vanten Altbestandsquellen zu finden sind. Wie konnte es dahin kommen? 
Die Deutsche Forschungsgemeinschaft hat im Programm Retrospektive Digi- 
talisierung von Bibliotheksbeständen seit 1997 eine Fülle von Projekten geför- 
dert, die zum Ziel hatten, den Direktzugriff auf für Forschung und Lehre 
wichtige Bestände, den Mehrfachzugriff auf viel genutzte Literatur, die 
digitale Bereitstellung schwer zugänglicher Bestände und die erweiterte 
Nutzung bisher nur wenig bekannter Materialien verbessern zu helfen. 
Diese Ziele konnten zwar in bemerkenswert vielen Einzelprojekten erreicht 
werden, doch lag die Kommunikation der Projekte untereinander und die 
Bündelung der Anstrengungen in einer gemeinsamen virtuellen Bibliothek 
trotz des programmatischen Namens Verteilte Digitale Forschungsbibliothek 
lange Zeit nicht im Brennpunkt der Aufmerksamkeit. Auch die für die Ko- 
ordination und Beratung der Digitalisierungsaktivitäten seinerzeit in Göt- 
tingen und München aus der Taufe gehobenen Digitalisierungszentren 
erfüllten diesbezüglich nicht die in sie gesetzten Erwartungen und konzen- 
trierten sich — durchaus erfolgreich - auf eigene Projekte.” Als Konsequenz 
dieser Entwicklung entstand eine buntscheckige Landschaft von digitalen 


? Adresse: http://books.google.com/. 


° Vgl. auch Thomas Stäcker: Das ist doch alles im Netz! - Angebot und Nutzen von digitalisierten 
Altbestandsquellen im Internet. Vortrag gehalten auf dem Bibliothekartag in Düsseldorf 2005. 
Adresse: http://www.opus-bayern.de/bib-info/volltexte/2005/73/. 

* Manfred Thaller und andere: „Retrospektive Digitalisierung von Bibliotheksbeständen” - 
Evaluierungsbericht über einen Förderschwerpunkt der DFG. Universität Köln 2005. 
http://www.dfg.de/forschungsfoerderung/wissenschaftliche_infrastruktur/lis/download/retro 
_digitalisierung_eval_050406.pdf (letzte Einsichtnahme am 18.11.2005). 


5 Ebd, S. 11. 
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Sammlungen auf unterschiedlichen technischen Plattformen ohne einheitli- 
che Standards. So ist es nur zu verständlich, dass heutige Nutzer, wie in 
der RetroEval-Studie festgestellt, nach einem zentralen Portal rufen und in 
den Äußerungen der Studie allenthalben ein Bedürfnis nach allgemeinen 
Standards in der Erschließung und Präsentation erkennbar ist. 

Um diesem gravierenden Mangel abzuhelfen, fördert die DFG seit 2004 
das Zentrale Verzeichnis Digitalisierter Drucke (zvdd). Neben dem Nachweis 
von Drucken gibt es aber auch noch andere Portale. Hier eine Übersicht 
über die wichtigsten nach Materialarten: 


— Mittelalterliche und frühneuzeitliche Handschschriften: manuscripta 
mediaevalia, 

- Autographen und Nachlassmaterialien: Kalliope, 

— Bundesarchiv, 

— Inkunabeln: INKA, vdlb, ISTC, 

— Drucke bzw. Zeitschriften: Zentrales Verzeichnis Digitalisierter Drucke 
(zvdd), 

- Bildarchive bzw. Kunstobjekte: Bildarchiv Foto Marburg. 


Mit den zentralen Portalen wie Manuscripta mediaevalia, Kalliope, zvdd oder 
auch, von fachwissenschaftlicher Seite aus durch die Virtuellen Fachbiblio- 
theken (Vifa) wird die Basis gelegt für übergreifende Suchen. Der konzep- 
tionell richtige Weg ist die präzise materialbezogene Beschreibung und erst 
in einem weiteren Schritt die materialunabhängige Abstraktion. Qualität 
und Quantität der Information stehen in einem umgekehrt proportionalen 
Verhältnis zueinander. In einem lokalen Projekt wird man die spezifischs- 
ten Informationen finden, in Google die allgemeinsten. Dazwischen liegen 
die material- und fachspezifischen Portale, die wissenschaftliche von nicht- 
wissenschaftlicher Information und Quellennachweisen trennen, die formal 
oder inhaltlich von der Materialbasis abstrahieren. Ich schicke diesen zen- 
tralen Aspekt vorweg, um deutlich zu machen, dass jede Form der Digitali- 
sierung ohne einen zentralen Nachweis verfehlt ist. Zumindest ein Eintrag 
im Katalog der Bibliothek muss verpflichtend sein. 

Ist das Digitalisat katalogisiert und der zentrale Nachweis gegeben: Wel- 
che Potentiale bietet die Digitalisierung frühneuzeitlicher Quellen. Wenn 
ich mich hier auf frühneuzeitliche Ressourcen beschränke, so will ich kei- 
ner speziellen Form der Digitalisierung für frühneuzeitliche Quellen das 
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Wort reden. Ich beschränke mich vielmehr auf Beispiele aus dem Bereich 
der frühen Neuzeit. Mutatis mutandis sind meine Ausführungen natürlich 
auch auf andere Materialien übertragbar. Welches sind also die aus meiner 
Sicht zentralen Entwicklungslinien für den bibliothekarischen und wissen- 
schaftlichen Umgang mit digitalen Ressourcen aus der frühen Neuzeit? Ich 
sehe hier vor allem drei Themenfelder: 


— Vernetzung 
- Kooperative Arbeit und ‚Content Syndication‘ 
— Elektronische Edition 


1. Vernetzung 


Gelegentlich fragt man sich, ob es eigentlich sinnvoll ist, eine Quelle zu di- 
gitalisieren, die bereits als Reprint vorliegt. Natürlich hat man als Privat- 
person oft nicht die Mittel, sich teure Reprints zu kaufen und natürlich ist 
es vorteilhaft, wenn man von überall her kostenfrei auf digitale Ressourcen 
zugreifen kann. Doch genügt das als Grund für die Digitalisierung? An die- 
se Überlegung knüpft sich die Frage, welche Rolle das Internet in Zukunft 
für die kultur- und geisteswissenschaftliche Forschung spielen wird. Bis- 
lang ist die Digitalisierung noch zu sehr vom Gedanken der Sekundärform 
geprägt. Das Digitalisiat wird als eine neben anderen Reproduktionen 
angesehen, wie ein Microfiche, -film, Papierkopie oder sonstige analoge 
Kopie. Darin wird jedoch das Potential eines Digitalisats unterschätzt, das 
vor allem darin beruht, im Web angeboten werden zu können. Eine digitale 
Kopie auf CD-ROM ist in der Tat im Prinzip nichts anderes als eine Papier- 
kopie, im Netz angeboten, entfalten sich dank der Hypertextualität des Me- 
diums jedoch andere Wirksamkeiten. Vor allem darin, in der Möglichkeit, 
Inhalte vernetzen zu können, so meine Behauptung, liegt der wissenschaft- 
liche Mehrwert der Digitalisierung, weit mehr als in einer bequemer zu- 
gänglichen Sekundärform. 

Wenn die Forschung, auch die geistes- und kulturwissenschaftliche, in 
Zukunft selber stärker das Internet als Publikationsmedium nutzen sollte, 
und dafür sprechen eine Reihe von Indizien, dann liegen die Vorteile der 
Vernetzung auf der Hand. Die Fußnote wird zum Link. Benutzte Quellen 
wie auch Sekundärliteratur lassen sich umgehend überprüfen. Kataloge 
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und wissenschaftliche Suchmaschinen fungieren als zuverlässige Dreh- 
scheiben dieser Vernetzung. Gerade die Möglichkeit, Quellen medieninte- 
gral in eine wissenschaftliche Arbeit einbeziehen zu können, ist eine attrak- 
tive Perspektive und ein wichtiger Antrieb für wohl alle derzeit unternom- 
menen Digitalisierungsprojekte. 

Dies ist oft mit geringem Aufwand zu ereichen, wie sich am Wolfenbütt- 
ler Projekt Leibnizressourcen Digital’ zeigt. In diesem Kooperationsprojekt 
mit der Berlin Brandenburgischen Akademie der Wissenschaften wurden 
rund 120 Titel in Wolfenbüttel digitalisiert und mit der Online-Edition der 
Naturwissenschaftlich-medizinisch-technischen Schriften von Leibniz ver- 
knüpft. Wo Leibniz einen Titel bzw. eine Passage zitiert, zum Beispiel aus 
den Experimenta nova des Otto von Guericke (Amsterdam 1672)’, kann man 
die fragliche Stelle seitengenau anspringen und das Buch gleichsam an die- 
ser Stelle aufblättern. Umgekehrt führt ein Button „citations“ vom Angebot 
der Wolfenbütteler Seite über eine Google-Suche nach Ressourcen, die den 
Link zitieren, unter anderem zu der Seite der BBAW, so dass beide Angebo- 
te bidirektional verlinkt sind. 

Voraussetzung für die Vernetzung bzw. Zitierfähigkeit ist ein stabiler 
Link: Die schon genannte PURL (Persitent URL), oder aber ein URN, der 
über einen Resolver funktioniert. In Wolfenbüttel gibt es hierfür verschie- 
dene Lösungen, die im Ausgang von der Signatur diverse Systeme bedie- 
nen (vergleiche Abbildung 1). 

Da die URN in Wolfenbüttel aus Aufwandsgründen - es müsste sonst 
bei der Deutschen Bibliothek für jede Seite eine eigene URN angelegt wer- 
den - nur auf Titelebene angewendet wird, wir aber für das Projekt die Sei- 
tenebene benötigen, arbeiten wir für die seitengenaue Verlinkung nur mit 
PURLs. Entscheidend ist aber weniger, wie es gemacht wird, wichtiger ist 
vielmehr, dass man überhaupt eine persistente Verlinkung mit eindeutigem 
Identifier für die Objekte vorsieht. An dem Beispiel wird auch deutlich, 
warum Wolfenbüttel neben Gründen der Authentizität relativ reserviert Se- 
kundärarchiven im Netz gegenübersteht. Denn Ressourcen, die diese Quel- 
len im Netz zitieren, werden von Wolfenbütteler Seite aus nicht mehr ohne 
weiteres gefunden. 


6 Adresse: http://www.hab.de/forschung/projekte/leibnizressourcen.htm. 
7 Adresse: http://diglib.hab.de/drucke/34-5-phys-2f/start.htm?image=00005. 


148 Thomas Stäcker 


Signatur des Originals: Einbl. Xb FM 28 
Signatur des Digitalisats: drucke einbl-xb-fm-28 (Grundbestandteil des 


Identifiers) 
URL: http./diglib.hab.de/wdb.php?dir=druckefeinbl -xb-fm-28 
(seit 2004; früher wie PURL) 
PURL: FHttp.’diglib.hab.de/drucke/einbl-xb-fm-28’start. htm 
(seit 1998) 
URN: uminbn:de:gbv:23-drucke'kb-53-2f-25 
(seit 2005) 


Hauseigener Resolver für die URN (und andere Identifier); 


http. #diglib .hab.de/?um=urn:nbride:gbw: 23 - drucke’einbl-xb-fm 285 
Resolver der Deutschen Bibliothek: 
http:#nbnn-resolving.de/umnresolver.pl?um=um:nbni:de: gbv:23 - drucke/einbl- 
xb-fm-285 
Abbildung 1 


2. Kooperative Arbeit und Content Syndication 


Das Internet erlaubt neue Kooperationsszenarien in der Bereitstellung digi- 
taler Quellen. Kooperationen lassen sich in quantitative, qualitative und 
technische unterscheiden. Während es bei der quantitativen Kooperation 
um die gemeinsame Bereitstellung von gleichartigen Objekten geht, zielt 
die qualitative auf die differenzierte und arbeitsteilige Bearbeitung ver- 
schiedener Schritte am selben Objekt. Technische Kooperationen wiederum 
verteilen inhaltliche und datenbanktechnische Prozesse auf verschiedene 
Partner oder gliedern einzelne technische Aspekte aus einem Angebot aus 
bzw. ‚sourcen’ sie aus. 

Als Beispiel zu einer quantitativen Kooperation möchte ich das Projekt 
vdIb? nennen. Die Universität Köln, die Stadt- und Universitätsbibliothek 
Köln und die Herzog August Bibliothek haben zusammen mehr als 1 300 
Inkunabeln und knapp 300 000 Seiten digitalisiert und inhaltlich erschlos- 
sen bzw. mit Strukturdaten zur Navigation versehen, wobei sie pragma- 
tisch bei 1485 eine Zeitgrenze gezogen haben. Titel, die älter als dieses Da- 
tum waren, wurden von Köln, jüngere von Wolfenbüttel digitalisiert. 
Obwohl Köln wie Wolfenbüttel die Quellen auf dem eigenen Server publi- 
zieren, werden doch beide unter einer Oberfläche zusammengefasst. Zu- 


ë Adresse: http://inkunabeln.ub.uni-koeln.de;. 
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gleich werden zum Beispiel die Ressourcen aus Wolfenbüttel über den 
OPAC der Bibliothek, daher mittelbar auch über den Verbund und den 
KVK, das Inkunabelportal INKA, den GW und den, allerdings noch nicht 
freigeschalteten, ISTC gefunden. 

So werden zum einen Inhalte bei distributiver Datenhaltung kooperativ 
zu für die frühneuzeitliche Forschung nützlichen Corpora aggregiert, zum 
anderen erlaubt die elektronische Datenhaltung Content Syndication über 
verschiedene Oberflächen und Angebote. Noch funktioniert es gewisserma- 
ßen zu Fuß. Daten werden in meist proprietären Formaten übertragen und 
eingearbeitet. Mit der weiteren Verbreitung von OAP - eine entsprechende 
Schnittstelle wird derzeit an der HAB implementiert - und verbindlichen 
Austauschformaten, werden sich diese Prozesse automatisieren. Äußerst ef- 
fektiv funktioniert das heute schon in der Blogger-Szene, die vor allem über 
RSS-Feeds Daten aggregiert und erfolgreich Content Syndication betreibt. 

Qualitative Kooperationen sind nach meinem Eindruck noch selten. Gera- 
de sie sind aber als Szenarien einer engeren Zusammenarbeit von Wissen- 
schaft und Bibliothek, von frühneuzeitlicher Forschung und Quellenbereit- 
stellung, besonders interessant. Ein kleines Beispiel sei die externe Erschlie- 
fung eines Wolfenbütteler Emblembuchs in einem niederländischen Projekt 
zur Liebesemblematik.'' Dort wurden zahlreiche Einzelembleme mit ICON- 
CLASS-Notationen' versehen und so differenziert erschlossen. Von den an- 
gebotenen Thumbnails gelangt man direkt zum Wolfenbüttler Digitalisat. 

Eine qualitative Zusammenarbeit findet auch mit dem Projekt Camena 
bzw. dem Thesaurus eruditionis statt". Vereinbart ist, Drucke, die bei Camena 
nicht vorhanden oder nicht digitalisierbar sind, in Wolfenbüttel zu digitali- 
sieren, des weiteren sollen einige dieser Drucke in Heidelberg im Volltext 
erfasst und getaggt werden, von den Heidelberger Volltexten kann man 
dann zu den Wolfenbütteler Images springen. 

Zuletzt möchte ich noch eine technische Kooperation im Projekt Festkul- 
tur Online” vorstellen. Das Projekt ist übrigens wie vdIb zugleich eine quan- 
titative Kooperation, insofern in Warwick bzw. der British Library und 
Wolfenbüttel Festbücher nach gleichen Richtlinien auf Seitenebene er- 


° Adresse: http://www.openarchives.org]. 

1 Unter Adresse: http://www.mnemosyne.org/mia/ mit Stichwort HAB suchen. 
1 Adresse: http://www.iconclass.nl. 

12 Adresse: http://www.uni-mannheim.de/mateo/camenahtdocs/camenaref.html. 
!? Adresse: http://www.hab.de/bibliothek/wdb/festkultur/index.htm. 
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schlossen und unter einer gemeinsamen Oberfläche in Wolfenbüttel ange- 
boten wurden. Der technische Aspekt der Kooperation gelang jedoch durch 
eine Zusammenarbeit mit ICONCLASS. ICONCLASS hat Wolfenbüttel 
einen eigenen Browser“ eingerichtet, der es erlaubt, bequem Notationen zu 
suchen. Ein echter Mehrwert für das Projekt. 


3. Elektronische Edition 


Großes Entwicklungspotential hat meines Erachtens innerhalb der Früh- 
neuzeitforschung die elektronische Edition. Der Begriff ist hier temptativ 
gebraucht, denn es ist definitorisch nicht einfach, eine elektronische oder 
digitale Edition in ihren Konstituentien eindeutig zu bestimmen. Man 
könnte natürlich argumentieren, sie enthält mindestens das, was eine ge- 
druckte Edition bietet. Jedoch erlaubt das Internet sowohl Skalierungen 
und Modularisierungen als auch, wiederum bedingt durch die Hypertex- 
tualität, andere Formen der Präsentation. 

Wir haben zum Beispiel in einer elektronischen Edition von Briefen 
Kirchers an Herzog August den Jüngeren” versucht, das Spektrum durch- 
zuspielen. Geboten werden auf der Basis von XML Transkription, Tran- 
skription mit einem zugegebenermaßen schmalen Apparat, ein Kommen- 
tar, der von Fletcher stammt, sowie eine Übersetzung - nicht zu verges- 
sen das digitale Image. 

In einem anderen Editionsprojekt, das in Zusammenarbeit von Jolanta 
Gelumbeckaite, Christian Heitzmann und mir durchgeführt wurde, hat Ge- 
lumbeckaite eine Transkription mit Fußnoten und eine Einleitung zu einer in 
Wolfenbüttel aufgefundenen Handschrift verfasst, Heitzmann und ich haben 
eine Übersetzung davon angefertigt. Die Transkription ist bereits zusammen 
mit den Images online", die komplexe Komplettedition mit Images, Überset- 
zung, Transkription und Einleitung wird als eigenständiges Werk in Kürze 
auch noch einmal separat online erscheinen. Obwohl es unsinnig erscheinen 
mag, werden die Images und die Transkription dort in der Tat noch einmal 


1 Zum Beispiel Adresse: http://icontest.iconclass.nl/libertas/ic?task=getnotation-&datum=9& 
style=notationbb_hab.xsl&taal=de beim Verfolgen des Links „Festkultur Online - HAB Wol-fen- 
büttel“ gelangt man direkt in die Festkulturdatenbank und findet Abbildungen zur Mythologie. 
"5 Adresse: http://diglib.hab.de/edoc/ed000005/start.htm. 


16 Adresse: http://diglib.hab.de/mss/11-14-aug-2f/start.htm?image=00261r. 
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angeboten. Wir kommen damit einerseits dem Wunsch der Deutschen Biblio- 
thek nach der Transferfähigkeit von digitalen Werken nach, mit anderen 
Worten, alle Bestandteile der Edition müssen leicht auch zur DDB übertragen 
werden können. Zum anderen betrachten wir die Images, wenn sie in eine 
elektronische Edition integriert sind, als eigenständig, denn sie werden in 
einen anderen editorischen Kontext eingebunden und fungieren nicht mehr 
nur als Faksimileedition mit gegebenenfalls Transkription. Derzeit ist eine 
weitere Transkription und Übersetzung von Heitzmann und mir in Arbeit, 
nämlich Justus Lipsius de bibliothecis, das noch nie ins Deutsche übertragen 
wurde. Als digitale Faksimiles online sind die Erstausgabe von 1602” und 
die für die Textüberlieferung relevante spätere Auflage von 1620". Weniger 
für die Übersetzung, aber für die Transkription sollen Textabweichungen no- 
tiert werden. Auch hier wird ein stufenweiser Editionsprozess verfolgt. Zu- 
nächst das digitale Faksimile, dann gegebenenfalls die Transkription oder 
Strukturdaten oder aber die Übersetzung. 

Was aber macht die Edition zur Edition? Im Kontext der Wolfenbütteler 
Bibliothek: Wann ist der Punkt gekommen, dass man von einer Faksimile- 
edition mit gegebenenfalls Strukturdaten und Transkription zu einer eigen- 
ständigen Publikation wechselt? Ich muss zugeben, dass uns das Problem 
bis heute Kopfzerbrechen bereitet. Um dies auch noch an einer anderen 
Baustelle zu veranschaulichen: 

Daniel Georg Morhofs Polyhistor wird nach den Images hier zitiert 
<http://diglib.hab.de/drucke/ea-490/start.htm> und als eigenständiger Text ist 
er zugleich vorläufig hier: <http://diglib.hab.de/drucke/ea-490/transcript-roh. 
htm> verfügbar. 

Wie gesagt, vorläufig, denn es handelt sich um einen nicht korrigierten 
und nur notdürftig getaggten Text, der gleichwohl nützlich ist. Ich denke, 
dass der Editionsstatus nicht verbindlich objektivierbar ist. Mindestens 
vorliegen müssen nach meinem Gefühl bei Werken der frühen Neuzeit 
die Images und die - mit Mindestmarkup versehene - Transkription. Al- 
lerdings sollte die Publikation auch eine entweder implizite oder explizite 
Erklärung des Autors enthalten, dass es sich nicht mehr um ‚work in pro- 
gress’ handelt. 


7 Adresse: http://diglib.hab.de/drucke/qun-59-9-1/start.htm. 
18 Adresse: http://diglib.hab.de/drucke/ba-474/start.htm. 
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Für die Bereitstellung von frühneuzeitlichen Texten kann man die verschie- 
denen Stufen in einem Schema gemäß Abb. 2 visualisieren, wobei meines 
Erachtens nur die Aspekte der Stufe 3 eine Edition konstituieren können. 
Man sieht hieran auch, dass nur wenige Texte editorisch aufbereitet werden 
können, viele jedoch digitalisiert, etwas weniger auf Titelebene inhaltlich 
differenziert erschlossen. Was die Quellen der frühen Neuzeit anlangt, so 
sehe ich die Stufe 1 und 2 technisch gelöst und hoffe, dass man in den 
nächsten 5 Jahren durch massive Digitalisierungskampagnen das Angebot 
substantiell verbessert. Bei der Stufe 3 sehe ich noch viele konzeptionelle 
Probleme, für die sich aber sicher in naher Zukunft Lösungen finden wer- 
den - nicht zuletzt durch das wachsende Interesse der Universitäten, Aka- 
demien und sonstigen Forschungseinrichtungen an digitalen Editionen, ein 
Interesse, das nach meiner Überzeugung in naher Zukunft zu einem ‚digi- 
tal shift‘ in der Editionslandschaft führen wird.Abbildung 2. Es steht zu 
hoffen, dass die digitale Quellenbereitstellung und -erschließung ein ko- 
operativer Prozess sein wird, der mit Blick auf die Quantität, die Qualität 
und die Technik arbeitsteilig die Potentiale des Internet nutzt und die Früh- 
neuzeitforschung, und nicht nur diese, nachhaltig zu befördern vermag. 


Archive in der digitalen Welt 


Informationstransfer zwischen Verwaltung und Wissenschaft 


Rainer Hering 


1. Einleitung 


„Auf meinem Rechner habe ich 10 000 E-Mails, die können Sie gern ha- 
ben“, entgegnete mir ein leitender Beamter einer Hamburger Behörde, als 
ich mich ihm als Archivar vorstellte und meine Aufgaben erläuterte. Die- 
ses bereitwillige Angebot, Unterlagen ins zuständige Archiv abzugeben, 
ist trotz der eindeutigen Rechtslage durch die Archivgesetze keineswegs 
selbstverständlich und daher nur zu begrüßen. Doch hinter diesem 
freundlichen Satz, der genauso gut aus dem privaten oder privatwirt- 
schaftlichen Bereich stammen könnte, verbergen sich gravierende Proble- 
me für Archive und für die historische Forschung. Und dabei handelt es 
sich trotz der relativ großen Zahl von E-Mails in erster Linie nicht um 
quantitative Schwierigkeiten. 

Bleiben wir zunächst noch bei dem Beispiel. Was können wir dem Satz 
„auf meinem Rechner habe ich 10 000 E-Mails, die können Sie gern ha- 
ben“ entnehmen? Offenbar pflegt dieser hohe Beamte eine umfangreiche 
elektronische Korrespondenz, die er lokal, das heißt auf seinem Rechner 
oder in einem Netzwerk, nur für ihn zugänglich, abgespeichert hat. Diese 
Schriftwechsel sind wohl nicht ausgedruckt, mit einer Verfügung verse- 
hen und in die zuständige Sach- oder Handakte gegeben worden. Auch 
im weiteren Verlauf des Gespräches fielen die Begriffe Akte und Registra- 
tur nicht. Die Schreiben sind also nicht im Kontext des jeweiligen Vor- 
gangs in einer Akte in der Zentralregistratur seines Amtes oder seiner 
Dienststelle zu finden, auch scheint es keine klassische Sachbearbeiterab- 
lage im Büro zu geben. 
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Offen bleiben muss die Anordnung dieser 10 000 E-Mails. Es kann aber 
vermutet werden, dass der Beamte sich selbst eine gänzlich individuelle, für 
seinen Arbeitsbereich geeignet erscheinende Systematik ausgedacht hat, die 
nur in seinem Kopf existiert und im Laufe der Zeit durch neue Erfordernisse 
und/oder die den Menschen eigene Inkonsequenz modifiziert worden ist. 
Denkbare Kriterien sind neben der Chronologie und dem Alphabet der 
Korrespondenzpartner Leitzeichen - seltener Geschäfts- oder Aktenzeichen -, 
Sachbetreffe, kreative Mischformen und nicht minder originelle Abkür- 
zungen. Eine für Außenstehende nachvollziehbare Dokumentation einer 
solchen Ablagesystematik existiert erfahrungsgemäß nicht. 

Aber es geht noch weiter: Dieser Ansammlung von E-Mails ist nicht zu 
entnehmen, wer sie gesehen hat, oft noch nicht einmal, wer sie geschrieben 
hat oder an wen sie gerichtet sind. Ein typisches Beispiel lässt das deutlich 
vor Augen treten: „Sehr geehrter Herr Müller, ich stimme Ihrem Vorschlag 
zu. Mfg gez. Dr. Schröder“. Das ist alles, weitere Angaben finden sich in 
dieser Mail, abgesehen vom Sende- bzw. Empfangszeitpunkt, nicht. Der 
Kopfzeile kann man noch entnehmen, dass ein Dr. Schröder, Max an einen 
Müller, Herbert geschrieben hat. Sollten darüber hinaus die E-Mail-Adres- 
sen der Beteiligten erkennbar sein, lassen sich gewisse Rückschlüsse auf 
ihren beruflichen Kontext treffen. Aber weder die Funktionseinheiten noch 
die Positionen der beiden Korrespondenzpartner sind ersichtlich. Die 
Betreffzeile ist oft nicht oder unpräzise ausgefüllt. 

Ich breche hier ab. Jeder von uns kennt derartige E-Mails und kann sie 
nur aufgrund der ihm individuell vorliegenden Kontextinformationen deu- 
ten. Ohne diese Person jedoch verlieren diese E-Mails deutlich an Aussage- 
kraft. 

Forschung in der digitalen Welt, die Sicherung, Erschließung und 
Aufbereitung von Wissensbeständen ist nicht nur ein technisches und/oder 
finanzielles Problem. Insbesondere die historische Forschung, allen voran 
die Geschichtswissenschaft, muss sich fragen, wieweit digitale Quellen 
auch eine modifizierte Methodik erfordern. Dabei kann sie von archivi- 
scher Seite unterstützt werden. Den Archiven kommt nämlich beim Infor- 
mationstransfer zwischen Verwaltung und Wissenschaft in der digitalen 
Welt eine zentrale Rolle zu. Durch die Veränderungen in den Registratur 
führenden Stellen, seien sie in Behörden, Firmen, Vereinigungen oder bei 
Privatpersonen, verändert sich die Arbeit der Archive - und auch ihre Nut- 
zerinnen und Nutzer müssen diese Entwicklungen nachvollziehen, wenn sie 
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eines Tages die Quellen des späten 20. und des 21. Jahrhunderts auswerten 
wollen. ' 


2. Globalisierung: Digitale Unterlagen in der Verwaltung 


Unternehmen der Privatwirtschaft werden durch ihre Kunden, durch die 
Globalisierung, durch neue Technologien und weitergehende Qualitätsan- 
forderungen genau so zum Handeln herausgefordert wie Verwaltungen im 
öffentlichen Dienst als Erbringer von Dienstleistungen für die Bürgerinnen 
und Bürger.” Ein zentrales Element der Verwaltungsmodernisierung in den 
öffentlichen Verwaltungen sind Electronic-Government-Konzepte.” Die von 
der Bundesregierung im September 2000 gestartete Initiative BundOnline2005 
betont, dass eine Informationsgesellschaft nicht ohne E-Government denk- 
bar ist. E-Government bezieht sich auf alle Aspekte von Regierung und 
Verwaltung, deren Arbeit durch den Einsatz von Informations- und Kom- 
munikationstechnologien unterstützt wird. Die Ziele einer solchen Moder- 
nisierung sind eine effizientere und rationellere Verwaltung, ein erhöhter 
interner Informationsaustausch, größere Transparenz des Verwaltungshan- 
delns und somit eine höhere Qualität der Dienstleistung.‘ In diesem Zu- 
sammenhang müssen daher auch die Verwaltungsprozesse zu Beginn der 
Implementierung von Dokumentenmanagementsystemen analysiert und 
optimiert werden, damit sie in der Verwaltung eine hohe Akzeptanz finden 
und erfolgreich eingesetzt werden können.’ Die Schriftgutverwaltung ‚hin- 
ter den Kulissen‘ muss effektiv, medienbruchfrei und den rechtlichen Vor- 


1 In diesem Beitrag erfolgt eine Konzentration auf Sachakten. 


? Michael Leistenschneider: Elektronische Signatur - Motor für E-Government. In: Innovative 
Verwaltung 4 (2004). S. 44 f. — Rainer Pitschas: Neues Verwaltungsrecht im partnerschaftlichen 
Rechtsstaat? Zum Wandel von Handlungsverantwortung und -formen der öffentlichen Verwal- 
tung am Beispiel der Vorsorge für innere Sicherheit in Deutschland. In: Die Öffentliche Verwal- 
tung 6 (2004). S. 231-238, S. 231 f. 


° Lars Lentfer: Die Notwendigkeit von E-Government-Strategien. In: Innovative Verwaltung 10 
(2002) S. 27 f. Vor übertriebenen Erwartungen im Kontext von E-Government-Konzepten warnt: 
Olaf Winkel: Zukunftsperspektive Electronic Government. In: Aus Politik und Zeitgeschichte 18, 
2004. S. 7-15. 


t Archive und ihre Nutzer - Archive als moderne Dienstleister. Beiträge des 8. Archivwissen- 
schaftlichen Kolloquiums der Archivschule Marburg. Hg. von Stefanie Unger (Veröffentlichun- 
gen der Archivschule Marburg, Institut für Archivwissenschaft 39). Marburg 2004. 


5 Ralf Heib: Nur der Nutzen zählt. In: Move Moderne Verwaltung November 2003. S. 22-25. 
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gaben entsprechend funktionieren, damit der Verkehr nach außen, die 
Kommunikation mit den Bürgerinnen und Bürgern, bestmöglich gestaltet 
werden kann. 

Verbunden damit ist, dass die Einführung dieser neuen Technologien 
auch mental begleitet wird, damit sie optimal eingesetzt werden können. 
Die neue Technik darf also nicht äußerlich aufgepfropft, sie muss innerlich 
angeeignet werden. Das Bewusstsein für einen ordnungsgemäßen Umgang 
mit den elektronisch gespeicherten Unterlagen ist erforderlich. Hier sind 
unterstützend die Archivarinnen und Archivare gefordert, die Behörden 
und Ämter gerade bei der Einführung von Dokumentenmanagement- 
systemen so zu begleiten, dass eine geordnete Schriftgutverwaltung 
gesichert ist.‘ 

Dieser Aneignungsprozess vollzieht sich erfahrungsgemäß nicht auto- 
matisch und nicht von heute auf morgen. Auch wenn Archivarinnen und 
Archivare die Modernisierung sachkundig begleiten, ist leider davon 
auszugehen, dass in den Verwaltungen - und dies gilt auch für den 
privat(rechtlich)en Bereich — die Schriftgutverwaltung auf absehbare Zeit 
nicht optimal funktioniert, dass man also aussagekräftige Unterlagen nicht 
in der Ordnung findet, wie man sie erwarten könnte. Das zu wissen, ist für 
die historische Forschung von zentraler Bedeutung. Die Recherchestrate- 
gien müssen diesem Defizit angepasst werden, und zugleich müssen bei 
der Interpretation der ermittelten Unterlagen mögliche Überlieferungs- 
lücken einbezogen werden. 


3. Digitale Unterlagen in den Archiven 


Für die Archive bedeutet die Umstellung auf ausschließlich elektronische 
Speicherung von Unterlagen, dass sich ihre Arbeit immer mehr auf das 


é Margit Ksoll-Marcon: Digitale Unterlagen - eine neue Herausforderung bei der Behördenbera- 
tung. In: Archive und ihre Nutzer - Archive als moderne Dienstleister. Beiträge des 8. Archivwis- 
senschaftlichen Kolloquiums der Archivschule Marburg. Hg. von Stefanie Unger (Veröffentli- 
chungen der Archivschule Marburg, Institut für Archivwissenschaft 39). Marburg 2004. S. 225- 
237. — Rainer Hering: Die Mentalitätsoffensive als zentrales Instrument der Archivierung von 
Unterlagen aus digitalen Systemen. In: Scrinium 58 (2004). S. 80-87. - Digitales Verwalten - Digi- 
tales Archivieren. 8. Tagung des Arbeitskreises Archivierung von Unterlagen aus digitalen Systemen 
am 27. und 28. April 2004 im Staatsarchiv Hamburg. Hg. von Rainer Hering und Udo Schäfer 
(Veröffentlichungen aus dem Staatsarchiv der Freien und Hansestadt Hamburg 19). Hamburg 
2004. 
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Vorfeld, das heißt die Schriftgut produzierenden und die registraturführen- 
den Stellen konzentrieren muss. Die archivischen Kontakte zu den Verwal- 
tungen im Sprengel müssen so ausgebaut und intensiviert werden, dass die 
Archivarinnen und Archivare rechtzeitig von der Entwicklung entspre- 
chender Verfahren Kenntnis erlangen und an wichtiger Stelle - zum Bei- 
spiel in begleitenden Gremien - beteiligt werden können. Die Qualität der 
Schriftgutverwaltung in den Behörden und Ämtern muss geprüft werden, 
damit diese bei den Implementierungsprozessen in den Verwaltungen ad- 
äquat beraten werden können. 

Diese Einbeziehung in das Verwaltungshandeln ist für die Archive von 
zentraler Bedeutung, da sich bei ausschließlich in digitalen Systemen ge- 
speicherten Unterlagen die Bewertungsentscheidung von der Schließung 
einer Akte auf ihre Eröffnung vorverlagern wird. Sobald ein Aktentitel ge- 
bildet worden ist, ist also bereits eine Entscheidung über die Archivwür- 
digkeit zu treffen. Daher ist die richtige Zuordnung und Erfassung der ein- 
zelnen Schriftstücke unbedingt erforderlich. Die archivische Erschließung 
wird sich in der Regel auf die Übernahme der Metadaten elektronischer 
Unterlagen konzentrieren. Dadurch entfällt ein großer Teil der bisherigen 
archivischen Tätigkeit, doch setzt eine solche Umstellung intensive Vorfeld- 
arbeit voraus, damit die dann als archivwürdig übernommenen Unterlagen 
auch benutzt werden können. Eine Sichtung der einzelnen Akten oder gar 
ein Neu- oder Umsortieren von falsch abgelegten Dokumenten wird in der 
Regel nicht mehr erfolgen können. 

Zusammenfassend lässt sich also festhalten, dass sich durch die Umstel- 
lung auf die ausschließliche elektronische Speicherung von Verwaltungs- 
unterlagen das Schwergewicht des archivischen Handelns von der retro- 
spektiven auf die prospektive Arbeit verlagert. Diese Veränderung und ihre 
Konsequenzen sollten die Historikerinnen und Historiker bei der Auswer- 
tung archivischer Quellen im Blick haben. 


4. Digitale Unterlagen und Historische Hilfswissenschaften 


Die künftig in Archiven überlieferten Quellen der historischen Wissen- 
schaften und ihre Entstehungsprozesse ändern sich also. Daher muss die 
Frage gestellt werden, ob nicht auch entsprechend die Methodik der Ge- 
schichtswissenschaft, auf jeden Fall die Quellenkunde, weiter entwickelt 
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werden muss. Das bisherige Angebot der Historischen Hilfs- bzw. Grund- 
wissenschaften umfasst unter anderem Paläographie, Diplomatik, Sphra- 
gistik, Heraldik, Genealogie, Numismatik und Geldgeschichte, Historische 
Geographie, Urkunden- und Aktenlehre.” Die relativ junge historische Bild- 
kunde sorgt dafür, dass im visuellen Zeitalter Bilder und Fotos nicht nur 
als mehr oder weniger zu den Texten passende Illustrationen verwendet, 
sondern auch zunehmend als historische Quellen methodisch fundiert ana- 
lysiert werden. Paläographie und Aktenkunde bieten notwendige Informa- 
tionen und Fähigkeiten zum Verständnis von Schriftgut, insbesondere Ur- 
kunden und neuzeitlicher Akten. Anredeformen, Aufbau von Schrift 
stücken, Vermerke, Geschäftszeichen etc. sind so interpretierbar — auch 
wenn man manchmal den Eindruck gewinnt, dass nicht immer in der erfor- 
derlichen Weise über den Text hinaus auch der Kontext eines Dokuments 
wahrgenommen wird. 

Wie aber sollen angesichts der eingangs geschilderten Situation nur noch 
elektronisch überlieferte Unterlagen angemessen gesichtet und interpretiert 
werden? Die vielfach erträumte vollständige Überlieferung aller entstandenen 
Dokumente ist langfristig durch die erforderliche Migration der Daten wohl 
nicht zu bewältigen und nicht sinnvoll. Eine denkbare Volltextrecherche wird 
aufgrund ihrer eingeschränkten Aussagekraft - hat man wirklich den richti- 
gen Begriff eingegeben? — und der zu erwartenden exorbitanten Trefferzahl 
nicht weiter helfen. Zudem: Die Gefahr, ein Schriftstück vollends aus seinem 
Entstehungszusammenhang zu isolieren und es somit nicht angemessen 
interpretieren zu können, ist groß. Der Kontext bildet auch im digitalen 
Zeitalter den Rahmen für seine Deutung. Es ist eben nicht egal, in welchem 


7 Ahasver von Brandt: Werkzeug des Historikers. Eine Einführung in die historischen Hilfswis- 
senschaften. 9., erg. Aufl. Stuttgart, Berlin, Köln, Mainz 1980. — Heinrich Otto Meisner: Archivali- 
enkunde vom 16. Jahrhundert bis 1918. Leipzig 1969. - Die archivalischen Quellen. Mit einer Ein- 
führung in die Historischen Hilfswissenschaften. Hg. von Friedrich Beck, Eckart Henning. 3., 
überarb. u. erw. Aufl. Köln, Weimar, Wien 2003. - Hans Wilhelm Eckardt, Gabriele Stüber und 
Thomas Trumpp unter Mitarbeit von Andreas Kuhn: Paläographie - Aktenkunde - Archivalische 
Textsorten. „Thun kund und zu wissen jedermänniglich” (Historische Hilfswissenschaften bei 
Degener & Co. 1). Neustadt/Aisch 2005. - Historische Hilfswissenschaften. Stand und Perspekti- 
ven der Forschung. Hg. von Toni Diederich und Joachim Oepen. Köln, Weimar, Wien 2005. 

® Rainer Wohlfeil: Das Bild als Geschichtsquelle. In: Historische Zeitschrift 243 (1986). S. 91-100. - 
Historische Bildkunde. Probleme — Wege - Beispiele. Hg. von Brigitte Tolkemitt und Rainer 
Wohlfeil (Zeitschrift für Historische Forschung, Beiheft 12). Berlin 1991. — Heike Talkenberger: 
Von der Illustration zur Interpretation: Das Bild als historische Quelle. Methodische Überlegun- 
gen zur Historischen Bildkunde. In: Zeitschrift für Historische Forschung 21 (1994). S. 289-313. 
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Zusammenhang ein Schriftstück entstanden oder überliefert worden ist. Seine 
Zuordnung zu einer Akte ist ebenfalls interpretationsrelevant. 

Gefragt werden muss dabei nicht nur nach dem, was überliefert ist, 
sondern gerade auch nach dem, was nicht vorhanden ist - und vor allem aus 
welchen Gründen. Sind die erwarteten Unterlagen gar nicht entstanden? Sind 
sie nicht oder nicht am erwarteten Ort gespeichert worden? Sind sie nicht 
dem zuständigen Archiv angeboten worden? Oder hat dieses sie nicht für 
archivwürdig befunden? 

Zudem: Im Bereich der Neueren und Neuesten Geschichte wird ver- 
gleichsweise selten nach der Echtheit eines Schriftstückes gefragt. Die angebli- 
chen Hitler-Tagebücher stellten eine herausragende, intensiv in der Öffent- 
lichkeit diskutierte Ausnahme dar. Eine Akte in einem Archiv reicht zumeist 
als Garantie für eine ungebrochene und unveränderte Überlieferung aus. Wie 
aber ist das im digitalen Zeitalter? Wie leicht elektronisch gespeicherte Unter- 
lagen verändert werden können, ist nur zu bekannt. Intensiv wird an digita- 
len Signaturen und ihren Einsatzmöglichkeiten gearbeitet.’ 

Die Liste von Fragen ließe sich unschwer verlängern. Deutlich wird, dass 
eine methodische Reflexion erforderlich ist, um die Auswirkungen, die die 
digitale Welt auf der Ebene der Quellen für die historische Forschung hat, zu 
untersuchen. Ist eine Weiterentwicklung der Historischen Hilfswissen- 
schaften erforderlich? 

Auf einem Workshop der Deutschen Forschungsgemeinschaft in Münster 
im Oktober 2004 über die Perspektiven der Kooperation zwischen Geschichts- 
wissenschaft und Archiven wurde angesichts der fortschreitenden Reduzie- 
rung der Historischen Hilfswissenschaften an den Universitäten und der zu 
geringen hilfswissenschaftlichen Vorkenntnisse der Archivbesucher disku- 
tiert, ob hier die Archive oder die Universitäten gefordert sind, diese Defizite 
abzubauen.” Angesichts der finanziellen und personellen Lage der Archive, 


° Udo Schäfer: Elektronische Signaturen oder Ius Archivi? In: Digitales Verwalten - Digitales Ar- 
chivieren. 8. Tagung des Arbeitskreises Archivierung von Unterlagen aus digitalen Systemen am 27. 
und 28. April 2004 im Staatsarchiv Hamburg. Hg. von Rainer Hering und Udo Schäfer (Veröf- 
fentlichungen aus dem Staatsarchiv der Freien und Hansestadt Hamburg 19). Hamburg 2004. 
S. 13-31. — Stefanie Fischer-Dieskau: Elektronisch signierte Dokumente. Anforderungen und 
Maßnahmen für ihren dauerhaften Erhalt. In: Ebd. S. 33-50. - Wolfgang Farnbacher: Technische 
und organisatorische Konzepte des ArchiSig-Projekts. In: Ebd. S. 51-65. — Jutta Drühmel: Digi- 
tale Signatur in der Praxis. Elektronsicher Rechtsverkehr am Finanzgericht Hamburg. In: Ebd. 
S. 67-68. 


1 Ragna Boden, Christine Mayr, Christoph Schmidt und Thomas Schwabach: Tagungsbericht: 
Die Geschichtswissenschaften und die Archive. Perspektiven der Kooperation. DFG-Workshop 
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die zweifelsohne nicht günstiger als die der Universitäten ist, kann diese Auf- 
gabe nicht von ihnen allein gelöst werden. Aber sie können gerade angesichts 
ihrer veränderten Rolle im Informationstransfer zwischen Verwaltung und 
Wissenschaft gemeinsam mit den Historischen Hilfswissenschaften die erfor- 
derliche Weiterentwicklung und Vermittlung des methodischen Rüstzeugs 
vorantreiben. Die Bedeutung der Historischen Hilfswissenschaften wächst 
angesichts der geschilderten Entwicklung. Wenn dies gesehen und konstruk- 
tiv genutzt wird, wird es eher möglich sein, die 10 000 E-Mails des einleitend 
zitierten leitenden Beamten einer Hamburger Behörde quellenkritisch und im 
Kontext für die historische Forschung nutzbar zu machen und insgesamt eine 
Erosion des kulturellen Gedächtnisses zu verhindern." 


am 05.10.2004 in Münster (H-SOZ-U-KULT 29.10.2004). 


"! Manfred Osten: Digitalisierung und kulturelles Gedächtnis. In: Aus Politik und Zeitgeschichte 
5-6/2006. S. 3-8. 


Nutzung von Digitalisaten am Beispiel des Geheimen 
Staatsarchivs Preußischer Kulturbesitz 


Dieter Heckmann 


Bevor die Nutzung im eigentlichen Sinne zur Sprache kommt, sei es mir 
gestattet, zunächst den Beginn, den derzeitigen Stand und die mittelfristi- 
gen Perspektiven der Digitalisierung im Geheimen Staatsarchiv in wenigen 
Strichen zu skizzieren. Im Anschluss daran möchte ich auf die Nutzung der 
elektronisch erzeugten Bilder im Rahmen der Gebührenordnung zu spre- 
chen kommen. Dabei sollen nicht nur Entgelte erläutert, sondern auch ur- 
heberrechtliche Fragen berührt werden. Zum Schluss gilt es, einige Vorstel- 
lungen und Gedanken über Nutzungsbeschränkungen und Nutzungswerte 
von Digitalisaten vorzustellen. 


Das Gutachten einer Wirtschaftsprüfungsgesellschaft, das der Präsident 
der Stiftung Preußischer Kulturbesitz für seine Einrichtungen 1993 in Auf- 
trag gegeben hatte, schlug hinsichtlich der künftigen Archivierungs- und 
Sicherungsstrategie des Geheimen Staatsarchivs unter anderem die Digita- 
lisierung vor. Ohne auf Einzelheiten eingehen zu wollen, sah das Gutach- 
ten bereits zwei Arten der Digitalisierung vor, nämlich einmal die unmittel- 
bare Umsetzung der Vorlagen mittels direkter Abtastung und andermal die 
Scannung der massenhaft vorhandenen Mikrofilme. Bei der zuletzt ge- 
nannten Art sollte nicht die Kopie des Sicherungsfilms, sondern die Kopie 
der Kopie, also die dritte Generation eines Films, zum Einsatz kommen. 
Hauptziele dieser Gutachervoten waren die Schonung der Bestände und 
die Steigerung der Effizienz. In Anbetracht der Benutzungshäufigkeit er- 
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scheinen diese Ziele nach wie vor geradezu geboten. Das Geheime Staatsar- 
chiv gehört nämlich mit rund 11 745 Benutzertagen jährlich und durch- 
schnittlich 4176 schriftlichen Anfragen im Jahr' zu den am häufigsten be- 
suchten Archiven in der Bundesrepublik Deutschland. Die Digitalisierung 
von besonders nachgefragten Beständen oder Bestandsteilen hatte deswe- 
gen Vorrang. Das Geheime Staatsarchiv ließ in den Jahren 1997 und 1998 
die ersten Schutzfilme, eine Anzahl von Findhilfsmitteln und sonstiges aus- 
gewähltes Schriftgut im Auftragswert von jeweils rund 350 000 DM digita- 
lisieren.” Stichproben ergaben, dass die Wiedergabequalität jedoch viel zu 
wünschen übrig ließ. Dies konnte besonders bei den Aufnahmen handge- 
schriebener Vorlagen festgestellt werden. Allerdings hängt die schlechte 
Qualität der Schutzfilme ursächlich mit der der frühen Sicherungsfilme zu- 
sammen, die wiederum mit dem Beginn der Sicherungsverfilmung in den 
Staatsarchiven Ende der 60er Jahre des vorigen Jahrhunderts im Zusam- 
menhang steht. Damals waren nämlich die heutigen Verfilmungsstandards 
erst in bescheidenen Ansätzen entwickelt. Die genannten Qualitätsprüfun- 
gen waren gerade für das Geheime Staatsarchiv besonders wichtig, weil die 
Masse der Bestände aus handgeschriebenem Schriftgut besteht, welches be- 
sonders gute bildliche Wiedergaben verlangt. Dass ungeachtet dessen die 
Digitalisierung der Rollfilmbestände auch nach 1999 fortgesetzt wurde, 
hing mit den mangelnden Alternativen zusammen. Seit 2002 ist allerdings 
die Digitalisierung der Schutzfilme wegen fehlender Haushaltsmittel aus- 
gesetzt worden. Im vergangenen Jahr konnten dennoch 211 Meter Rollfilm 
mittels eines Dupliziergerätes in hauseigener Regie kopiert werden. Die 
Anzahl der bis 2005 hergestellten Images beträgt rund 4,5 Millionen. Die- 
sen 4,5 Millionen Bildern liegen 2 450 Schutzfilme zugrunde.’ Benutzbar 
sind die Images jedoch noch nicht, weil die Verknüpfung mit den Metada- 
ten fast ausnahmslos fehlt. Hier ist noch ein riesiger Arbeits- und Kosten- 
aufwand erforderlich, bis die Koppelung an die in der Augias-Datenbank ge- 
speicherten Findbucheinträge bewerkstelligt ist. Erste Ergebnisse sollen 
aber im Laufe diesen Jahres für die Online-Recherche im Forschungssaal 
des Geheimen Staatsarchivs zur Verfügung stehen. Auf eine preußische 


1 Zugrunde liegen die aus den Jahresberichten ermittelten Durchschnitte der Jahre von 1996 bis 
2005. 


? Jahresbericht 1997, S. 34. 


3 Laut Auskunft des zuständigen Referenten vom 9. März 2006 seien rund 4,5 Millionen Images 
von 2450 Schutzfilmen auf circa 6800 Compact Disks zu 4 Terabytes gebrannt worden. 
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Akte von durchschnittlich 250 Blatt kämen so gerechnet 500 Images, was 
bei 4,5 Millionen digitaler Bilder 9 000 Akteneinheiten oder 1 000 laufende 
Meter Archivgut bedeutet. Trotz dieser gewaltigen Menge an digitalen Auf- 
nahmen ist somit erst ein Bruchteil des Gesamtumfanges digitalisiert. Der 
Rest von rund 34 laufenden Kilometern Schriftgut wäre noch entsprechend 
zu bearbeiten und vor allem zu finanzieren. Vielleicht bietet die kurz vor 
der industriellen Einführung stehende Hologrammtechnik in naher Zu- 
kunft soviel an Anreizen, dass damit die heute bekannten Speicherträger 
für Digitalisate kostengünstiger und wirkungsvoller ersetzt werden kön- 
nen.’ 

Dem angesprochenen Digitalisierungsaufwand hat das Geheime Staats- 
archiv auch eine herkömmliche Alternative - nicht zuletzt dank der noch 
vorhandenen paläographischen Lesefähigkeiten — entgegensetzen können, 
nämlich die Bestandserschließung mittels Vollregesten. Im gleichen Zeit- 
raum, also von 1997 bis 2005, haben eine halbe Projektstellenkraft und zeit- 
weilig zwei Referatsleiter des Geheimen Staatsarchivs immerhin rund 10,5 
laufende Meter frühneuzeitliches Schriftgut regestiert und in Buchform der 
Öffentlichkeit zur Verfügung gestellt.’ Während sich die Wertschöpfung bei 
der Schutzfilmdigitalisierung noch erweisen muss, liegt der volkswirt- 
schaftliche Nutzen bei den veröffentlichten Vollregesten klar auf der Hand: 


* Siehe dazu: Cornelia Denz: Volumenhologramme - Datenspeicher der Zukunft. In: Physikali- 
sche Blätter 55, 1999 Nr. 4. S. 41-45; Universität Münster entwickelt holographischen Speicher. In: 
Golem.de. Adresse: http://www.golem.de/0403/30558.html (letzte Einsichtnahme am 22.03.2006). 


? Dieter Heckmann (Bearb.): Die Beziehungen der Herzöge in Preußen zu West- und Südeuropa 
(1525-1688). Regesten aus dem Herzoglichen Briefarchiv und den Ostpreußischen Folianten 
(Veröffentlichungen aus den Archiven Preußischer Kulturbesitz 47). Köln, Weimar, Wien 1999; 
Stefan Hartmann (Bearb.): Herzog Albrecht von Preußen und Livland (1534-1540). Regesten aus 
dem Herzoglichen Briefarchiv und den Ostpreußischen Folianten (Veröffentlichungen aus den 
Archiven Preußischer Kulturbesitz 49). Köln, Weimar, Wien 1999; Stefan Hartmann (Bearb.): Her- 
zog Albrecht von Preußen und Livland (1540-1551). Regesten aus dem Herzoglichen Briefarchiv 
und den Ostpreußischen Folianten (Veröffentlichungen aus den Archiven Preußischer Kulturbe- 
sitz 54). Köln, Weimar, Wien 2002; Stefan Hartmann (Bearb.): Herzog Albrecht von Preußen und 
Livland (1551-1557). Regesten aus dem Herzoglichen Briefarchiv und den Ostpreußischen Foli- 
anten (Veröffentlichungen aus den Archiven Preußischer Kulturbesitz 57). Köln, Weimar, Wien 
2005; Ursula Benninghoven (Bearbeiterin): Die Beziehungen Herzog Albrechts von Preußen zu 
Städten, Bürgertum und Adel im westlichen Preußen (1525-1554). Regesten aus dem Herzogli- 
chen Briefarchiv und den Ostpreußischen Folianten (Veröffentlichungen aus den Archiven Preu- 
fischer Kulturbesitz 48, 1-2). Köln, Weimar, Wien 2006; Stefan Hartmann (Bearb.): Herzog Al- 
brecht von Preußen und Livland (1557-1560). Regesten aus dem Herzoglichen Briefarchiv und 
den Ostpreußischen Folianten (Veröffentlichungen aus den Archiven Preußischer Kulturbesitz 
60). Köln, Weimar, Wien 2006. 
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Der Leser kann die mittels der Regesten aufbereiteten und im Buch zur 
Verfügung gestellten Nachrichten bequem ohne besondere Vorkenntnisse 
sprachlicher, paläographischer oder sonstiger Art und ohne zeit- und kos- 
tenträchtige Archivbesuche für seine Zwecke verwenden. 

Der Vollständigkeit halber sei in diesem Zusammenhang in wenigen 
Worten noch der Anteil der Direktscans erwähnt. Er beträgt derzeit nur we- 
nige hundert Bilder. Bei diesen handelt es sich in der Regel um die Ablich- 
tung ausgewählter Stücke, zumeist aus der Kartenabteilung, die für Katalo- 
ge, Prospekte und dergleichen hergestellt wurden. Trotz ihrer geringen An- 
zahl verblüffen die Images durch ihre gute Qualität. Sie ist vor allem dem 
Einsatz moderner Aufnahme- und Wiedergabetechnik geschuldet. 

An direkten Aufnahmen sind in zunehmendem Maße Archivbenutze- 
rinnen und Archivbenutzer interessiert, die mit Hilfe eigener Digitalkame- 
ras Ablichtungen vornehmlich aus Akten anzufertigen wünschen. Diesem 
Ansinnen hat die Benutzungsordnung des Geheimen Staatsarchivs einen 
Riegel vorgeschoben. In der seit dem 2. Januar diesen Jahres in Kraft be- 
findlichen Ordnung? heißt es nämlich unter § 8 Absatz 1: Die Anfertigung 
von Reproduktionen durch Benutzerinnen bzw. Benutzer ist grundsätzlich nicht 
zulässig. Ausnahmen bedürfen der ausdrücklichen Genehmigung durch den Di- 
rektor. Diese Regelung bedeutet keine Neuerung, denn sie findet sich wört- 
lich in der alten Benutzungsordnung vom 9. Juni 1995 wieder. Stand hinter 
der Formulierung von 1995 aber noch die Sorge um den Bestandserhalt im 
Vordergrund, so ist nun diese (im Hinblick auf die die Vorlagen schonende 
Abtasttechnik) dem Gesichtspunkt der Verwertung gewichen. Angesichts 
knapper werdender Haushaltsmittel ist das Archiv mehr denn je auf Ein- 
nahmen von Dienstleistungen aus der hauseigenen Bildstelle angewiesen. 
So kostet beispielsweise eine digitale Farbaufnahme 18 Euro. Derselbe Preis 
gilt auch für einen Color-Durchlicht-Scan. Der Auftraggeber hat sogar 
32 Euro zu entrichten, wenn er eine digitale Aufnahme von einer drei- 
dimensionalen Vorlage, wie zum Beispiel von einem Aktenband, von einer 
Urkunde, einem Siegel oder von einer Medaille, wünscht. Die Höhe dieser 
Gebühren soll einen Mittelwert zwischen den reinen Herstellungskosten 
und den marktüblichen Preisen widerspiegeln. 

Die Nutzung der bei der Bildstelle des Geheimen Staatsarchivs in Auf- 
trag gegebenen Aufnahmen ist an strenge Auflagen geknüpft. So wird die 


° Adresse: http://www.gsta.spk-berlin.de/framesets/frameset.php (letzte Einsichtnahme am 
27.03.2006). 
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Auftraggeberin oder der Auftraggeber eigens auf folgende Bedingungen 
hingewiesen: 


„Die von der Bildstelle des Geheimen Staatsarchivs PK angefertigten 
Reproduktionen sind nur zum direkten persönlichen Gebrauch der 
Auftraggebenden bestimmt. Alle Nutzungs- und Verwertungsrechte 
an den Reproduktionen liegen beim Geheimen Staatsarchiv PK. Die 
Weitergabe oder Überlassung der Reproduktionen an Dritte sowie 
die Vervielfältigung in jedweder Art (Reproduzieren, Kopieren, 
Digitalisieren, Duplizieren, Archivieren, Scannen, Speichern etc.) 
zum Zweck der Weitergabe oder Überlassung an Dritte sind ver- 
boten. Digitale Reproduktionen sind ohne Aufforderung unmittelbar 
nach dem persönlichen Gebrauch zu löschen. Jede Nutzung über den 
persönlichen Gebrauch hinaus, insbesondere die Veröffentlichung, 
bedarf der Genehmigung des Geheimen Staatsarchivs PK. Eine Ver- 
öffentlichung ist honorarpflichtig, soweit sie gewerblichen Zwecken 
dient. Diese Bedingungen gelten für alle vom Geheimen Staatsarchiv 
PK zur Verfügung gestellten Reproduktionen. Sie gelten auch dann, 
wenn das Bildmaterial über Dritte oder aus anderen Quellen in Besitz 
genommen wird (vergleiche Benutzungsordnung 8 8 Ziff. 3 i. d. F. 
vom 9. Dezember 2005).”” 


Stellt eine Benutzerin oder ein Benutzer trotz des Verbotes in der Benut- 
zungsordnung eigenmächtig Aufnahmen von Archivalien des Geheimen 
Staatsarchivs her, droht ihr oder ihm höchstens ein zeitlich begrenztes Haus- 
verbot; hält sich doch der Schaden in Grenzen, der mit einem derartigen Ver- 
halten verursacht wird. Selbst bei heimlich angefertigten Aufnahmen mittels 
einer eigenen Digitalkamera erwirbt — wie oben bereits dargelegt — die Be- 
nutzerin beziehungsweise der Benutzer weder Verwertungs- noch Urheber- 
rechte. Davon abgesehen gilt die Anfertigung einer Digitalaufnahme nicht 
im Sinne von § 2 Absatz 2 des Urhebergesetzes als geschütztes Werk, denn 
der eigenschöpferische oder gestalterische Anteil bei der Erzeugung eines 


7” Aus der Sammlung der allgemeinen Textbausteine entnommen (letzte Einsichtnahme am 
27.03.2006). 
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solchen Bildes ist nicht oder kaum erkennbar. In dieser Hinsicht lässt sich 
die Digitalaufnahme mit einer Fotokopie vergleichen. 

Die angesprochenen Dienstleistungen der Bildstelle schließen auch die 
Nutzung der Urheberrechte durch das Archiv ein. Dies gilt in der Regel un- 
eingeschränkt für diejenigen Photographinnen oder Photographen, die mit 
dem Archiv arbeitsrechtlich durch unbefristete Verträge verbunden sind, 
denn die Überlassung der Nutzungsrechte an den eigenen Bildern ist übli- 
cherweise Bestandteil des Anstellungsvertrages mit dem Arbeitgeber. Bei 
zeitlich befristeten Arbeitsverhältnissen oder gar bei Werkverträgen sieht 
die Rechtslage vielfach anders aus. Gerade bei Werkverträgen sollte die Ar- 
beitgeberin oder der Arbeitgeber tunlichst darauf achten, dass ihr oder ihm 
die ausschließlichen Nutzungsrechte vertraglich überlassen werden.’ Sonst 
haben die entsprechende Photographin oder der Photograph oder die Er- 
ben das Recht, die im Rahmen des Vertrages entstandenen Aufnahmen 
selbst zu verwerten, was zum Beispiel bei häufig nachgefragten Bildern aus 
Katalogen zu erheblichen Einnahmen für sie oder ihn oder umgekehrt zu 
großen Einnahmeverlusten für das Archiv führen kann. 

Bekanntermaßen erlöschen die Urheberrechte einer Photographin oder 
eines Photographen oder ihrer oder seiner Erben erst 70 Jahre nach dem To- 
desfall. Dank dieser Regelung kann das Geheime Staatsarchiv die Samm- 
lung seiner Digitalisate, die nach § 2 Absatz 2 des Urhebergesetzes als Werk 
geschützt sind, zügig erweitern, um eine künftige Einnahmequelle einzu- 
fassen. 


Was die weiteren Beschränkungen in der Nutzung einerseits sowie ande- 
rerseits die Nutzungswerte von Digitalisaten anbelangt, so heißt es zwar im 
§ 4 Absatz 1 der Benutzungsordnung des Geheimen Staatsarchivs, dass das 
Archivgut und dessen hand- oder schreibmaschinenschriftliche Findmittel 
sowie das Bibliotheksgut der Dienstbibliothek nur im Forschungssaal des 
Archivs benutzt werden . Diese Regelung wird aber in dem Maße durchlö- 
chert, je mehr Findmittel in digitaler Form online oder auch in gedruckter 
Form angeboten werden. Beispiele dafür geben sowohl die schon online re- 


x Jan A. Strunk: Die Geister, die ich rief ... In: Computer-Fachwissen 1 (2004). S. 27-30, S. 30. 
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cherchierbaren Karten als auch die gedruckten Regestenwerke, die die voll- 
ständige Signatur jedes einzelnen Stücks mitteilen, das regestiert worden 
ist. Diese Schwachstelle in der Benutzungsordnung lässt sich jedoch leicht 
umkehren, wenn mit der Erlaubnis zur aushäusigen Benutzung, zum Bei- 
spiel via Internet, künftig Entgelte verbunden werden. Entsprechende Vor- 
bilder aus einigen Bundesländern’ liegen bereits vor. 

Wie bereits angedeutet, sollen im Verlauf diesen Jahres die ersten Ver- 
knüpfungen zwischen Metadaten und den dazu gehörenden Images für 
die Bildschirmrecherche im Benutzersaal des Geheimen Staatsarchivs zur 
Verfügung gestellt werden. Mit diesem Pilotprojekt sollen die Nachrichten 
aus denjenigen Akten wieder zugänglich gemacht werden, die wegen Ent- 
säuerungsmaßnahmen” für die Benutzung unzugänglich geworden sind. 
Wie früher die Mikrofiches sollen die Images heute als Ersatz für die ge- 
sperrten Akten dienen. Da diese Akten für die Restaurierung aus ihren 
Heftungen gelöst und jetzt mittels ‚Chemises’ — darunter sind Umschläge 
mit Seitenklappen zu verstehen - zusammengehalten werden, sind die lo- 
sen Akten nur noch aus triftigen Gründen vorlegbar. Ein triftiger Grund 
wäre etwa gegeben, wenn versehentlich eine Seite nicht verfilmt ist. Ver- 
langt jedoch der Benutzer wegen mangelnder paläographischer Lesefähig- 
keit die Herausgabe der Papiervorlage, so wird ihm in der Regel die Ein- 
sicht verwehrt. 

Sollten die Haushalte jedoch - und das ist zu befürchten — mittelfristig 
eine Verknüpfung der bereits jetzt erzeugten 4,5 Millionen Images des Ge- 
heimen Staatsarchivs mit ihren Metadaten nicht mehr zulassen, dürfte der 
soeben beschriebene Einsatz von Digitalisaten zu den vernünftigsten Arten 
der Umsetzung gehören. Von daher sollte der Verwendung von Digitalisa- 
ten zum Schutz der vom Zerfall bedrohten Vorlagen unbedingt Vorrang 
eingeräumt werden. 


? Sowohl in Bremen (über Staatsarchiv Bremen, Präsident-Kennedy-Platz 2, 28203 Bremen) als 
auch in Hamburg wurden seit den 1830er Jahren von den Schiffsmaklern Verzeichnisse mit per- 
sönlichen Daten und Angaben zur Herkunft der Passagiere für die Polizeibehörden zusammen- 
gestellt (Adresse: http://linktoyourroots.hamburg.de, letzte Einsichtnahme am 26.04.2006). Eine 
Namensrecherche ist nur gegen Gebühr beim Staatsarchiv der Freien und Hansestadt Hamburg, 
Kattunbleiche 19, 22041 Hamburg, möglich. 

Dazu kritisch Dieter Heckmann: Paläographie: eine archivische Dienstleistung mit Zukunft. In: 
Regionen Europas - Europa der Regionen. Festschrift für Kurt-Ulrich Jäschke zum 65. Geburts- 
tag. Hg. von Peter Thorau, Sabine Penth und Rüdiger Fuchs. Köln, Weimar, Wien 2003. S. 287- 
295, S. 292 f. Netzversion Adresse: http://people.freenet.de/heckmann.werder/Palaeographie.htm. 
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Eine weitere Mengendigitalisierung scheint darüber hinaus derzeit nur 
noch bei ausgewählten Vorlagen finanzierbar zu sein. Die Auswahl sollte 
sich hierbei freilich von der Entwicklung der Nachfrage leiten lassen. So ist 
schon seit Jahren erkennbar, dass maschinengeschriebene Vorlagen weit 
oben in der Gunst der Benutzerinnen und Benutzer liegen und sich zudem 
wachsender Beliebtheit auch bei Wissenschaftlerinnen und Wissenschaft- 
lern erfreuen. Das Lesen dieser Vorlagen bedarf nämlich keiner paläogra- 
phischen oder sonstigen hilfswissenschaftlichen Vorbildung. Hinzu 
kommt, dass wegen der weitgehenden Normierung der maschinenschriftli- 
chen Zeichen selbst Digitalisate von Aufnahmen mittelmäßiger oder gar 
schlechter Wiedergabequalität von den Benutzerinnen und Benutzern vor- 
behaltlos angenommen werden. 


Das Angebot der Archive in der digitalen Welt 


Retrokonversion, Datenaustausch und Archivportale 


Frank M. Bischoff und Udo Schäfer 


In seinem Beitrag über Archive und Internet‘ berichtete Karsten Uhde, dass 
im Jahr zuvor gerade einmal fünf archivische Einrichtungen in Deutsch- 
land - darunter zwei Ausbildungsstätten — mit einer Website im Internet 
vertreten waren. Die Veröffentlichung dieser Aussage liegt jetzt zehn Jahre 
zurück und bezog sich auf das Jahr 1995. Ein Blick auf die Linkliste der Ar- 
chivschule Marburg? und insbesondere in die dort benannten Portale zeigt, 
dass sich dieser Zustand nachhaltig geändert hat. Es gibt keinen Bereich in- 
nerhalb des deutschen Archivwesens, der in der jüngeren Vergangenheit 
eine vergleichbar rasante Entwicklung erlebt hätte. 

Das hat gute Gründe. Wollen Archive als Dienstleister gegenüber ande- 
ren Informationsprovidern konkurrenzfähig bleiben, müssen sie ihre Kun- 
den verstärkt mit Online-Informationen im Internet versorgen. Das Werben 
um Benutzer und Kunden beginnt heute nicht mehr erst in den Lesesälen, 
sondern bereits im Internet. In einer Gesellschaft, die sich zur Informations- 
beschaffung mit weiterhin zunehmender Tendenz der Recherchemöglich- 
keiten in Rechnernetzwerken bedient, gehen Einrichtungen, die dort nicht 
präsent sind, inzwischen das sehr reale Risiko ein, gar nicht wahrgenom- 
men zu werden. Für den Internetbenutzer existieren sie de facto nicht. 

Gerade deshalb müssen sich Archivare heute in dem Maße, in dem die 
eingehende Erforschung der eigenen Bestände im Alltag der Archivarbeit 
immer seltener ihren Platz finden kann, verstärkt als Informationsbroker 


1 Karsten Uhde: Archive und Internet. In: Der Archivar 49 (1996). Sp. 205-216, bes. 206. 


= Vgl. Adresse: http://www.archivschule.de/content/33.html (letzte Einsichtnahme am 26.05. 
2006). 
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betätigen und ihre Bestände einem interessierten Publikum vermitteln. Was 
nachgefragt ist, sind Inhalte, also Beständeübersichten und Findbücher, die 
in weitaus größerem Umfang im Internet bereitgestellt werden müssen, als 
das heute der Fall ist. Bei allem Respekt vor der inzwischen beachtlichen 
Präsenz deutscher Archive im Internet bestehen auf diesem Gebiet noch er- 
hebliche Desiderate. Ähnlich wie große Universitätsbibliotheken in 
Deutschland fast flächendeckend ihre Kataloge online zugänglich gemacht 
haben, sollten auch Archive ihre Findmittel — natürlich unter Beachtung 
persönlichkeitsschutzrechtlicher Bestimmungen und gegebenenfalls ande- 
rer rechtlicher Einschränkungen - ins Netz stellen. Es handelt sich hier zu- 
gleich um eine ideelle Pflicht von Archiven im Rahmen ihres Charakters als 
Häuser der Geschichte, Gedächtnis der Gesellschaft und vor dem Hinter- 
grund ihrer Mitverantwortung für die historisch-politische Bildung. Eine 
Digitalisierung von Archivgut, die Erstellung von Online-Zimelienschauen 
oder Internet-Ausstellungen gehören demgegenüber immer noch eher zur 
Kategorie der Kür. Damit soll keineswegs in Abrede gestellt werden, dass 
die letztgenannten Bereiche das Publikum ansprechen und werbewirksam 
sein können. 

Im Hinblick auf die aktuellen Anforderungen an und Perspektiven für 
archivische Internet-Informationsangebote will dieser Beitrag im Folgen- 
den drei Fragen nachgehen: 


— Welche Bedeutung kommt Archivportalen zu? 

— Welchen Stellenwert haben Schnittstellen und welche Ansprüche sollten 
sie erfüllen? 

— Wie ist die Bereitstellung einer großen Zahl von Findmitteln im Internet 
realisierbar? 


1. Archivportale 


In 2005 verabschiedete der Rat der Europäischen Union eine Reihe von 
Empfehlungen über vorrangige Aktionen zur Stärkung der Zusammenar- 
beit im europäischen Archivwesen.’ Es handelt sich dabei um Maßnahmen 
zur Schadensprävention, um verstärkte interdisziplinäre Zusammenarbeit 


$ Vgl. die deutsche Zusammenfassung unter Adresse: http://eur-lex.europa.eu/LexUriServ/ 
site/de/0j/2005/1_312/1_31220051129de00550056.pdf (letzte Einsichtnahme am 26.05.2006). 
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bei elektronischen Unterlagen, um rechtliche Regelungen zu Verwaltung 
von und Zugang zu Schrift- und Archivgut sowie um vorbeugende Maß- 
nahmen gegen Archivgutdiebstahl. 

Neben diese vier Empfehlungen von eher generellem Charakter tritt 
eine fünfte, die sich im Vergleich zu den übrigen fast als Spezialauftrag 
liest. Der Rat der Europäischen Union empfiehlt nämlich, in den nächsten 
Jahren folgende Maßnahme gemeinsam durch Mitgliedstaaten und EU-Or- 
gane umzusetzen: 


„Einrichtung und Betreuung eines Internet-Portals für Dokumente 
und Archive in Europa.“ 


Die Empfehlung wird wie folgt spezifiziert: 


„Bereitstellung eines Internet-Portals durch die Nationalarchive der 
Mitgliedstaaten und die Archivdienste der EU-Organe, um den 
grenzüberschreitenden Zugang zu Dokumenten und Archiven der 
Mitgliedstaaten und der EU-Organe zu erleichtern. Dieses Internet- 
Portal könnte vom Nationalarchiv eines Mitgliedstaats betreut 
werden.” * 


Der Empfehlung des Rats liegt der Bericht über die Archive in der erweiter- 
ten Europäischen Union zugrunde.’ Im Auftrag der Europäischen Kommis- 
sion war dieser Bericht von einer Gruppe nationaler Sachverständiger mit 
dem Ziel eines Aktionsplans für eine erweiterte europäische Kooperation 
auf dem Gebiet des Archivwesens erarbeitet worden. 

Der Sachverständigenbericht befasst sich in zwei Abschnitten‘ mit Online- 
zugang zu Findmitteln und Internetportalen. Die geforderte Einrichtung ei- 
nes europäischen Internet-Gateways soll die bislang disparaten europäi- 
schen Internet-Initiativen bündeln und Benutzern einen One-Stop-Shop für 
den Zugang zu archivischen Informationen bieten. Erhöhte Benutzer- 


* Ebd, Ziff. B. 3. 

Š Report on Archives in the enlarged European Union. Increased archival cooperation in Europe: 
action plan, elaborated by the National Experts Group on Archives of the EU-Member States and 
EU-Institutions and Organs, Adresse: http://www.archives.gov.ua/News/EuroUnion/report_- 
Archives.pdf (letzte Einsichtnahme am 26.05.2006). 


° Ebd., Kapitel 2c und 2d, S. 55 ff. 
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freundlichkeit und die Bereitstellung einer kritischen Masse von archivi- 
schen Informationen auf europäischer Ebene ist das Ziel der aufgestellten 
Forderungen. Das europäische Archivportal soll nach Auffassung der na- 
tionalen Sachverständigen mindestens drei Schichten umfassen: 


- Die Integration aller Daten aus archivischen Webpräsentationen in re- 
cherchierbarer Form. 

— Eine Crawler-Abfrage auf Findmittel, die mangels geeigneter Schnitt- 
stellen nicht integrierbar sind, aber mit ‚Google-Techniken‘ recherchiert 
werden können. 

- Eine Link-Liste zu bibliothekarischen Verbundkatalogen, wo gedruckte 
Findmittel nachgewiesen werden. 


Allgemeine Informationen über die Archive, wie Adressen, Öffnungszeiten 
etc. sowie Hilfestellungen zu verschiedenen Themenbereichen sollen das 
Portal komplettieren. 

Wie lässt sich diese ausgesprochen konkret formulierte Forderung nach 
einer Portallösung auf europäischer Ebene erklären? Dass die Europäische 
Union den Archiven ihrer Mitgliedsländer zu erhöhter Aufmerksamkeit 
und den Bürgern zu verbesserten Möglichkeiten der Informationsabfrage 
verhelfen möchte, scheint unmittelbar einleuchtend. Warum aber wird der 
Portalgedanke derart betont? 

Um diese Forderung näher zu beleuchten, sei hier beispielhaft auf ein 
konkretes Portalprojekt zurückgegriffen. Als das nordrhein-westfälische 
Archivportal 1998 im Internet frei geschaltet wurde, war es das erste seiner 
Art. Es schien dem Grundkonzept des Internet, der ungesteuerten, indivi- 
duellen Bereitstellung von Information, fast zu widersprechen, dass unter 
der Adresse <http://www.archive.nrw.de> mit einem Schlag allgemeine In- 
formationen und Beständeübersichten zu 430 Archiven bereitgestellt wur- 
den.’ 

Ungeachtet aller Diskussionen um das Konzept von archive.nrw.de erwei- 
sen die Nutzungszahlen das von der Deutschen Forschungsgemeinschaft 


7 Über Motive und Hintergründe der seinerzeitigen Entwicklung ist genügend publiziert wor- 
den, so dass eine weitere Thematisierung an dieser Stelle unnötig ist. Vgl. zugleich auch stellver- 
tretend für andere Veröffentlichungen Wilfried Reininghaus und Frank M. Bischoff: Archive in 
Nordrhein-Westfalen im Internet. Bericht über ein von der Deutschen Forschungsgemeinschaft 
unterstütztes Pilotprojekt. In: Der Archivar 51 (1998). Sp. 411-426. 
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geförderte Portal als Erfolg. Mit rund eine Million Hits pro Monat’ darf die 
Website als sehr gut besucht gelten. Wo liegen die Ursachen eines solchen 
Erfolgs? 

Die wichtigste Voraussetzung ist sicherlich, dass hier Inhalte angeboten 
werden. Mit 430 Beständeübersichten dürfte Nordrhein-Westfalen noch 
heute das Bundesland sein, das seine Archivlandschaft in der Fläche am 
breitesten beschreibt. Auswertungen der nachgefragten Inhalte zeigen sehr 
deutlich, dass die Beständeübersichten im Zentrum des Interesses von In- 
ternetbesuchern stehen.” 

Ein weiterer Grund besteht sicherlich in der Breite des Angebots. Die 
Archivlandschaft Nordrhein-Westfalen ist in dem Portal archive.nrw.de aus- 
gesprochen dicht dokumentiert. In einem archivischen Internet-Verbund- 
system kann der Nutzen von Informationsangeboten folglich maximiert 
und ein informationeller Mehrwert für den Nutzer wie auch für die Archi- 
ve geschaffen werden. Einerseits wird es den beteiligten Archiven ermög- 
licht, sich mit eigener Homepage und eigener Beständeübersicht zu präsen- 
tieren. Andererseits kann der Benutzer eine archivübergreifende Recherche 
durchführen und dabei auch auf unerwartete Treffer stoßen. Im Unter- 
schied zu den gängigen Suchmaschinen genügt die Qualität der Recherche- 
ergebnisse in einem Fachinformationssystem einem gewissen Mindeststan- 
dard, so dass der Benutzer zugleich vor einer Vergoogelung‘ geschützt ist. 

Ein weiterer Vorteil eines Portals mag schließlich auch darin liegen, dass 
eine einheitliche Rechercheoberfläche für die Ermittlung von archivischen 
Informationen genutzt werden kann und dass die vorhandenen Informatio- 
nen in einer fachlich angemessenen, einheitlichen Struktur organisiert sind. 

Die Errichtung von Portalen ist inzwischen auch in einer Reihe anderer 
Bundesländer erfolgt. Portale erleichtern den Zugriff auf einzelne Archive 
oder Gruppen von Archiven erheblich. Insofern kann hier den Sachverstän- 
digen der Europäischen Kommission nur zugestimmt werden, wenn diese 
die Auffassung vertreten, dass Portale in Zukunft verstärkt eingerichtet 
oder ausgebaut werden sollten, vor allem im Interesse von Benutzern, aber 


3 Vgl. die Nutzungsstatistik unter Adresse: http://www.archive.nrw.de/statistik/default.html, ein- 
gesehen am 26.5.2006. 


° Vgl. Frank M. Bischoff: Das Projekt Archive in NRW im Internet. Nutzung und Fortschreibung. 
In: Archivpflege in Westfalen und Lippe 53 (2000). S. 13-19, und ders.: Die Ausweitung archivi- 
scher Informationsvermittlung im nordrhein-westfälischen Internetportal und der Beitrag der 
Archive. In: Archivpflege in Westfalen und Lippe 57 (2002). S. 50-56. 
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auch im Interesse der Archive. Wenn der Rat der Europäischen Union die- 
ses Gateway von den Nationalarchiven betreuen lassen möchte, dann wird 
damit den Größenverhältnissen im Archivwesen Rechnung getragen. Die- 
sen Aufwand können nur große Archivverwaltungen auf sich nehmen; 
kleine Archive wären damit auf lange Sicht überfordert. 

Vor dem Hintergrund der bestehenden Regionalportale in Deutschland 
und der Forderung nach einem EU-Archivportal wird eine Lücke offen- 
kundig: Es fehlt ein Archivportal, das auf nationaler Ebene die Angebote 
der Archive in Deutschland bündelt. Zwar wird in dem Sachverständigen- 
bericht der EU-Kommission ausgeführt, dass in Deutschland die Einrich- 
tung eines nationalen Archivportals in Bearbeitung sei.” Jedoch haben sich 
diese Arbeiten zunächst noch einmal verzögert. Ein deutsches Archivportal 
könnte die archivischen Internetressourcen sowohl gegenüber internationa- 
len Archivverbünden als auch gegenüber weiter gefassten nationalen oder 
internationalen Informationsverbünden auf dem Gebiet des kulturellen Er- 
bes gebündelt repräsentieren. Eine derartige Bündelung, die auf den Ho- 
mepages und regionalen Portalen der deutschen Archive aufbauen müsste, 
würde auf nationaler Ebene eine Informationsmasse vermitteln, deren Be- 
deutung Benutzern und anderen Gateway-Betreibern unmittelbar augen- 
fällig würde. 


2. Schnittstellen, Austausch- und Präsentationsformate 


Das Beispiel von archive.nrw.de lehrt auch, dass ein Portal ohne Informati- 
onszuwachs ab einem bestimmten Zeitpunkt zu stagnieren droht. Die Auf- 
nahme neuer Archive, die Ausweitung oder Überarbeitung von Bestände- 
übersichten sowie die Bereitstellung von weiteren, für Benutzer relevanten 
Informationen ist seit Einrichtung des Systems sehr langsam erfolgt. Seit 
Ende des Jahres 2002 lässt sich beobachten, dass sich die Nutzungsfrequenz 
auf die bereits erwähnten eine Million Hits pro Monat eingependelt hat, de 
facto also stagniert, wenngleich auf hohem Niveau. Ein Portal benötigt da- 
her auch Informationszuwachs, um sich langfristig zu behaupten. In Nord- 
rhein-Westfalen werden die Weichen seit einiger Zeit in diese Richtung ge- 


1 Report, wie Anm. 5, S. 61. 
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stellt: Das bisher auf Beständeübersichten beschränkte Portal wird gerade 
um die Findbuchebene erweitert. 

Ein derartiges Portal ist mit Hilfe von Fördermitteln der DFG vor weni- 
gen Jahren in einem anderen Bundesland zum Abschluss gebracht worden. 
In Mecklenburg-Vorpommern wurde unter Federführung des Universitäts- 
archivs Greifswald das Ariadne-Portal geschaffen,” in dem Archive ihre Be- 
ständeübersichten und Findbücher im Internet bereitstellen können. 

Die im Ariadne-Portal vorgesehenen Findmittelstrukturen entsprechen 
durchaus dem in Deutschland üblichen Archivstandard. Ähnlich wie archi- 
ve.nrw.de kennt Ariadne Beständeübersichten mit in die jeweilige Tektonik 
eingebetteten Beständen sowie Findbücher mit Klassifikationen, an deren 
untersten Zweigen jeweils die Archivalieneinheiten hängen. Ariadne unter- 
scheidet vier Archivalienarten, neben Sachakten auch Urkunden, Personal- 
akten und Karten. 

Die Beteiligung an dem Ariadne-Portal setzt in der Praxis voraus, dass 
die Archive auch die Ariadne-Erschließungssoftware einsetzen.” Diese kann 
als lokale Anwendung in einem lokalen Netz, aber auch als zentrale An- 
wendung auf dem Ariadne-Rechner des Rechenzentrums der Universität 
Greifswald, genutzt werden. Mit diesem Ansatz ist das Ariadne-Portal im 
Prinzip dem nordrhein-westfälischen Vorgehen gefolgt. Auch in Nord- 
rhein-Westfalen haben die Archive eine lokale Software zur Pflege ihrer Be- 
ständeübersichten erhalten. Hier ist also die Frage berührt, ob eine Grund- 
voraussetzung zur Errichtung eines Portals darin bestehen muss, dass alle 
beteiligten Archive dieselbe Software nutzen. 

Blicken wir nochmals für einen Moment in die Entwicklungsphase von 
archive.nrw.de im Jahr 1997 zurück. Mit dem Vorhaben, ein zentrales Ar- 
chivportal einzurichten, dessen Inhalte dezentral gepflegt werden sollten, 
stellte sich zugleich die Frage, wie die Beständeinformationen verschiede- 
ner Archive in einer inhaltlich und technisch einheitlichen Struktur auf 
einen zentralen Internetserver geladen werden können. Es drängte sich der 
Gedanke auf, eine Bestände-Software zu entwickeln und alle beteiligten Ar- 
chive zu verpflichten, dieses Werkzeug für die Pflege ihrer Beständeüber- 


1 Archive Information & Administration Network, Adresse: http://ariadne.uni-greifswald.de 
(letzte Einsichtnahme am 26.05.2006). 

12 An dieser Stelle sei Herrn Dr. Matthias Manke, Landeshauptarchiv Schwerin, für den freundli- 
chen Hinweis auf die bestehende ASCII-CSV-Importschnittstelle von Ariadne gedankt, die es er- 
möglicht, ohne den Einsatz der Software Findmittel-Daten in Ariadne zu importieren. 
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sichten zu nutzen. Die Software wurde den beteiligten Archiven kostenlos 
zur Verfügung gestellt. Die Beständeübersicht des jeweiligen Archivs wur- 
de bei der Übergabe der Software als Datenbank bereitgestellt. 

Bei der Beurteilung dieses Vorgehens ist zu berücksichtigen, dass vor 
neun Jahren die Ausgangssituation eine andere war als heute. Es existierten 
keine marktgängigen Systeme zur Pflege von Beständeübersichten. Das 
heißt, dass mit der Bereitstellung eines solchen Tools weder eine Umge- 
wöhnung der Archive noch eine Marktverzerrung verbunden war. Für die 
beteiligten Archive gab es nur Vorteile, für Softwarehersteller mangels 
kommerzieller Produkte keine Nachteile. 

Das ist heute anders. Erstens gibt es inzwischen Hersteller, die auch Sys- 
teme zur Pflege von Beständeübersichten in ihrer Softwarepalette anbieten. 
Vor allem aber zielen die heutigen Bestrebungen auf die Findbuchebene, 
ein Bereich, für den in Deutschland seit Jahren schon eine Reihe von Pro- 
dukten am Markt erhältlich ist. Und diese Produkte werden ebenfalls be- 
reits seit Jahren in Archiven zur Verzeichnung und Erstellung von Findbü- 
chern eingesetzt. Insofern kann die Verpflichtung zur Nutzung eines be- 
stimmten Systems zur Bestückung eines Internet-Portals weder für die Ar- 
chive noch für den Softwaremarkt - letztlich profitieren die Archive von ei- 
ner Marktvielfalt - ein probates Verfahren sein. 

Damit wird ein gravierendes Defizit innerhalb des deutschen Archivwe- 
sens offenbar. Im Gegensatz zu den Bibliotheken haben sich die deutschen 
Archive in der Vergangenheit nicht in ausreichendem Maße mit der elek- 
tronischen Kommunizierbarkeit und Austauschbarkeit ihrer Erschließungs- 
informationen beschäftigt. Solange Findmittel nur in Buchform oder als 
Karteikarten existierten, bestand angesichts der Einzigartigkeit von Archiv- 
gut dazu vielleicht auch wenig Anlass. Gewisse Quasi-Standards wurden 
über die Ausbildung und über archivfachliche Publikationen verbreitet. 
Mit der Einrichtung von Informationsverbünden fällt dieses Defizit aber 
auf die Archive zurück, da elektronische Systeme nicht unscharf umrissene 
Quasi-Standards, sondern nur eindeutig definierte Strukturen und Elemen- 
te verarbeiten können. Es hat heute den Anschein, als seien Lösungen in ei- 
nem eher durch Individualität geprägten Metier schwer zu finden. 

Als das Hauptstaatsarchiv Düsseldorf vor fünf Jahren das Projekt zur 
Retrokonversion von Findmitteln startete, stellten sich ähnliche Fragen. 
Das Projekt zielte in erster Linie auf die Entwicklung eines Werkzeugs, das 
die automatische oder halbautomatische Konversion maschinengeschrie- 
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bener oder gedruckter Findmittel in eine strukturierte digitale Umgebung 
leisten sollte. Schnell war klar, dass dies nur die eine Hälfte der Aufgabe 
sein konnte. Die andere musste darin bestehen, die in ein digitales Format 
konvertierten Findbücher mit relativ geringem Aufwand in verschiedene 
Zielsysteme zu portieren. Die Lösung schien in der Schaffung eines XML- 
gestützten Austauschformates zu liegen, das in seinen Strukturen und Ele- 
menten eindeutig definiert war.'” Wenn in bestehenden Erschließungsda- 
tenbanken dieses Austauschformat als Importformat definiert und einge- 
bunden würde, könnten die Archive die konvertierten Findbücher mühelos 
in ihre Software laden. 

Das im Rahmen des Düsseldorfer Retrokonversionsprojekts entwickelte 
Austauschformat ist folglich darauf ausgerichtet, jede isolierbare oder in 
Findbüchern inhaltlich oder optisch als eigenständig erkennbare Informati- 
on als separates Element in einem XML-Dokument abzulegen, um auf die- 
se Weise jeglichen Informationsverlust und etwaige Nach- und Mehrarbeit 
zu vermeiden. Wie der Name bereits aussagt, dient es dem verlustfreien 
Austausch von Erschließungsinformationen zwischen verschiedenen Syste- 
men. Es ist nicht zur Internet-Präsentation von Erschließungsinformationen 
entwickelt worden. 

Es entspricht durchaus den auch das deutsche Archivwesen prägenden 
föderalen Strukturen, wenn inzwischen weitere Einrichtungen XML-DTDs 
für Findmittel entwickelt haben. Dies ist nicht nur beim Ariadne-Portal der 
Fall, das auch den Import von XML-Dokumenten vorsieht und zu diesem 
Zweck eine eigene DTD definiert hat. Auch der von der Archivschule Mar- 
burg in Kooperation mit dem Bundesarchiv entwickelte Findbucheditor 
MidosaXML' verfügt über eine eigene DTD. MidosaXML ist zugleich das 
einzige in Deutschland existierende Verzeichnungsprogramm, das derzeit 
mit einer funktionierenden EAD-Schnittstelle ausgestattet ist. Mit Midosa- 
XML kann sozusagen per Knopfdruck ein EAD-konformes XML-Findbuch 
exportiert werden. MidosaXML liegt unter anderem die Philosophie frei 
austauschbarer Findmittelinformationen zugrunde, was in dem System 
über verschiedene Import- und Exportroutinen realisiert wird. Es wäre 


B Vgl. Stefan Przigoda: Das Ziel- und Austauschformat als universelle Findbuch-DTD, Adres- 
se: http://www.archive.nrw.de/dok/tagung-retro/11-Przigoda.pdf (letzte Einsichtnahme am 
26.05.2006). 


1 Vgl. Adresse: http://www.archivschule.de/content/26.html (letzte Einsichtnahme am 26.05. 
2006). 
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wünschenswert, wenn dieser Grundgedanke allmählich auch in andere ar- 
chivische Erschließungssysteme Eingang finden würde. 

Die ISO-Norm ‚Encoded Archival Description’ (EAD) findet bisher in 
Deutschland außerhalb des Bundesarchivs wenig Beachtung. Aus der Per- 
spektive eines verlustfrei arbeitenden Austauschformats mag das seine Be- 
rechtigung haben, da EAD manche Besonderheiten von historischen Archi- 
valientypen nicht berücksichtigt. Zudem umfasst EAD Elemente, die die 
deutsche Erschließungstradition kaum kennt. Formuliert man die Ansprü- 
che aber anders und fragt, ob EAD als Präsentationsformat für eine Inter- 
net-Präsentation von Findmitteln geeignet sein könnte, muss die Antwort 
positiv ausfallen. Informationen, die als Kernelemente einer Erschließung 
gelten dürfen, sind in EAD berücksichtigt. Insbesondere verfügt EAD über 
eine hierarchische Struktur, die auch der deutschen Erschließungstradition 
von Tektonikebenen und Beständen, Findbüchern mit Klassifikationen und 
Archivalieneinheiten entspricht. 

Was also wird benötigt, um Erschließungsinformationen im Internet in 
geeigneter Weise darzustellen? Das nordrhein-westfälische Beständeportal 
differenziert neun verschiedene Elemente. Auf dem Internetserver werden 
die in diesen Elementen erfassten Informationen aber zusammengefügt 
und in einem einzigen Feld abgelegt. Mag man das auch heute als zu grob- 
rastrig empfinden, so ist die Zahl der sinnvoller Weise zu differenzierenden 
Informationen, damit der Benutzer gezielt bestimmte Informationen re- 
cherchieren und abfragen kann, sicherlich eng begrenzt und müsste unter- 
halb von zehn Elemente liegen. Mehr würde eine Überforderung der meis- 
ten Benutzer darstellen, würde die Recherche erheblich verkomplizieren 
und wäre damit kontraproduktiv. Deutsche Archivare täten sicher gut dar- 
an, wenn sie von der ihnen offensichtlichen Vielfalt von Erschließungsde- 
tails im Interesse von Benutzern abstrahieren und sich bei der Internetprä- 
sentation von Findmitteln auf ein überschaubares Raster beschränken wür- 
den. Weniger kann hier mehr sein. 

Ungeachtet der Skepsis deutscher Fachkolleginnen und -kollegen gegen- 
über EAD sei an dieser Stelle nachdrücklich hervorgehoben, dass EAD das 
leisten kann und als Präsentationsformat im Internet sehr gut geeignet ist. 
Einmal mehr sei auf den Sachverständigenbericht über die Archive in der 
erweiterten Europäischen Union verwiesen, der EAD als internationalen 
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Archivstandard empfiehlt und eine Reihe von europäischen Internetres- 
sourcen zitiert, die auf EAD aufbauen.” 

Bevor man also eine Findmittel-Kodierung nach EAD ablehnt, sollte 
gründlich geprüft werden, welche erheblichen Mängel gegen seinen Ein- 
satz als Präsentationsformat sprechen. Da die Deutsche Forschungsgemein- 
schaft in den vergangenen Jahren im Rahmen zweier Projekte bereits die 
Entwicklung zweier unterschiedlicher Findmittel-DTDs finanziert hat, soll- 
te auch kritisch geprüft werden, ob die Notwendigkeit zur Entwicklung ei- 
ner dritten wirklich besteht. Auch hier kann weniger mehr sein. 

Es sei nochmals unterstrichen, dass eine erfolgreiche Einrichtung von 
zentral zugänglichen, aber inhaltlich dezentral gepflegten Archivportalen 
in Zukunft die Existenz von anerkannten und eindeutigen Schnittstellen er- 
fordert. Die dazu notwendigen Sachentscheidungen müssen von Archiven 
getroffen und am besten von entsprechenden Empfehlungen archivischer 
Gremien begleitet werden. Ohne derartige Schnittstellen werden es Archiv- 
portale schwer haben, eine kritische Masse von Findmitteln aus einer mög- 
lichst großen Zahl von Einrichtungen zusammenzuführen. 


3. Internetfindmittel und Retrokonversion 


Archivportale bieten Archiven wie Benutzern einen hohen Komfort für die 
Bereitstellung von Erschließungsinformationen im Internet, Schnittstellen 
sind eine wichtige Voraussetzung für die Kommunikation von Erschlie- 
ßungsdaten zu Portalen. Bleibt der Frage nachzugehen, wie in möglichst 
kurzer Zeit eine möglichst große Zahl von Findmitteln digital aufbereitet 
werden kann. 

Archivische Findmittel sind und bleiben Generationenwerk und können 
in absehbarer Zeit nicht neu erstellt werden. Vor diesem Hintergrund müs- 
sen die bereits in den Bibliotheken eingesetzten Strategien der Retrokon- 
version auch in den Archiven zum Einsatz gelangen. In Anlehnung an die 
bibliothekarische Terminologie wird im Folgenden unter ‚Retrokonversion‘ 
die Umsetzung älterer Findmittel in ein digitales Format verstanden. Die 
Übertragung erfolgt dabei im Wesentlichen unverändert, ist also nicht von 
nennenswerten Nach- oder Neuverzeichnungsarbeiten begleitet. 


"Report, wie Anm. 5, S. 61 f. 
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In deutschen Archiven wurden in den vergangenen Jahren unterschied- 
liche Ansätze zur Retrokonversion verfolgt. Das Hauptstaatsarchiv Düssel- 
dorf hat ein Werkzeug entwickelt, das es ermöglicht, aufgrund von inhaltli- 
chen und Layout-Merkmalen die in maschinengeschriebenen oder ge- 
druckten Findmitteln enthaltenen Informationen zu identifizieren, zu zerle- 
gen und strukturiert in einem XML-Dokument abzulegen. Das Werkzeug 
ist mit Fördermitteln der DFG entwickelt worden und kann folglich von 
deutschen Archiven nachgenutzt werden." 

Die Stiftung ‚Archiv der Parteien und Massenorganisation der DDR’ im 
Bundesarchiv hat in den letzten Jahren mehrfach Findmittelretrokonversio- 
nen im Rahmen von Fremdaufträgen abgewickelt. Die Aufträge wurden 
zum Teil in Rumänien durch händische Erfassung in einem strukturierten 
Format abgewickelt. Sofern es sich um handschriftliche Findmittel handelt, 
ist die händische Erfassung zugleich die einzige Möglichkeit der Überfüh- 
rung in ein digitales Format. 

Die hessischen Staatsarchive schließlich haben mit eigenem Personal un- 
terstützt durch Projekt-Hilfskräfte ihre maschinengeschriebenen Findmittel 
in den letzten Jahren gescannt, mit OCR bearbeitet, die elektronischen Tex- 
te dann händisch strukturiert und in ihre Datenbank HADIS eingespeist. In 
Wiesbaden und in Darmstadt ist der größte Teil der Arbeiten zum Ab- 
schluss gelangt. 

Die drei genannten Beispiele zeigen, auf welchen Wegen klassische 
Findbücher schnell und kostengünstig in elektronische Formate umgewan- 
delt werden können. Welche Methode die geeignete ist, hängt von der Qua- 
lität und vom Umfang des Ausgangsmaterials ab. Das muss sicherlich im 
Einzelnen geprüft werden. An dieser Stelle sei lediglich unterstrichen, dass 
eine Retrokonversion die einzige Möglichkeit ist, Findmittel in großer Zahl, 
kostengünstig und schnell im Internet bereitzustellen. Es wäre fatal, wenn 
der Qualitätsanspruch dabei zu hoch geschraubt würde. Hier ist vielmehr 
eine pragmatische Herangehensweise gefordert. Ein Findbuch der 60er Jah- 
re, das lediglich eine Kurztitelverzeichnung bietet, kann im Internet für vie- 
le Benutzer von großem Wert sein. Wird es zurückgehalten, weil zuvor eine 
Neuerschließung erfolgen soll, dürfte der Bestand angesichts durchaus be- 
trächtlicher Erschließungsrückstände in vielen Archiven auf Jahre hinaus 


16 Vgl. den Abschlussbericht zum DFG-Projekt Entwicklung von Werkzeugen zur Retrokonversion 
archivischer Findmittel unter Adresse: http://www.archive.nrw.de/dok/dfg_abschluss/abschlussbe- 
richt_retrokonversionsprojekt.pdf (letzte Einsichtnahme am 26.05.2006). 
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für den Internetbenutzer verloren sein. Archive, die den notwendigen Prag- 
matismus zu derartigen Veröffentlichungsentscheidungen aufbringen, soll- 
ten darin gestützt und gefördert werden. 

Inzwischen gibt es seitens der Deutschen Forschungsgemeinschaft ein- 
deutige Aussagen, die deutschen Archive in ihren Bemühungen um die Re- 
trokonversion von Findmitteln in den nächsten Jahren zu unterstützen. Das 
ist ermutigend und lässt hoffen, dass die deutschen Archive in fünf bis 
zehn Jahren einen großen Schritt auf dem Weg der Online-Bereitstellung 
von Erschließungsinformationen getan haben werden. Das setzt ein ra- 
sches, zielorientiertes Handeln der Archive voraus. Es muss bei der Retro- 
konversion darum gehen, schnell und kostengünstig eine große Masse von 
Findmitteln zu bearbeiten und im Internet bereitzustellen. Dass es sich da- 
bei um frei zugängliche Bestände bzw. Findmittelinformationen handeln 
muss, ist selbstverständlich. Hier aber die Frage der Bedeutung eines Be- 
standes für den einen oder anderen Aspekt der geschichtlichen Forschung 
einzumischen, würde die Gefahr unerträglicher Verzögerungen in sich ber- 
gen. Insofern sollte die Retrokonversion von Findmitteln zwar planmäßig, 
aber auch pragmatisch betrieben werden. 


4. Zusammenfassung 


Zum Abschluss seien die wesentlichen Aussagen nochmals in kurzen The- 
sen zusammengefasst: 


— Portale machen die Archivlandschaft einer Region oder einer Sparte 
transparent und bieten sowohl Benutzern wie Archiven einen informatio- 
nellen Mehrwert. Ihre Einrichtung oder Erweiterung sollte daher voran- 
getrieben werden. Es besteht dringender Bedarf, ein nationales Gateway 
einzurichten, das die deutsche Archivlandschaft gegenüber nationalen 
oder internationalen Informationsverbünden auf dem Gebiet der histori- 
schen Forschung und des kulturellen Erbes bündelt und vermittelt. 

- Zur Kommunikation von Erschließungsinformationen werden Schnitt- 
stellen benötigt. Die deutschen Archive müssen hier längst überfällige 
Entscheidungen treffen und sich rasch auf Standards einigen. Es muss 
sich nicht zwangsläufig um eine einzige Austausch- oder Präsentations- 
schnittstelle handeln, notwendigerweise aber um wenige, wobei im 
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Hinblick auf einen internationalen Austausch EAD inzwischen unab- 
dingbar dazugehört. Ohne definierte Schnittstellen werden Findmittel 
auch in Zukunft nur mit hohem Kostenaufwand kommunizierbar sein 
oder im Zweifelsfall isoliert in proprietären Umgebungen verbleiben. 
Die Retrokonversion archivischer Findmittel sollte zügig und nach sehr 
pragmatischen Gesichtspunkten vorangetrieben werden, um Internetbe- 
nutzern möglichst rasch eine kritische Masse von Findmitteln zur Verfü- 
gung stellen zu können. Eine Förderung durch die Deutsche For- 
schungsgemeinschaft ist inzwischen zugesagt und muss jetzt von den 
deutschen Archiven in Ergebnisse umgesetzt werden. 


Geschichtswissenschaft auf dem Weg zur 
E-History? 


Angelika Schaser 


Fünf Themenkreise standen auf der Tagung Forschung in der digitalen Welt. 
Sicherung, Erschließung und Aufbereitung von Wissensbeständen im Mittel- 
punkt. Die ‚Probleme und die Chancen der Digitalisierung‘ (Thaller, Sahle, 
Heller/Vogeler), die ‚Macht der Bilder und die Beschleunigung der wissen- 
schaftlichen Diskussion’ über die Visualisierung archäologischer Befunde 
(Schäfer), ‚Quelleneditionen’ im Bereich der mittelalterlichen und frühneu- 
zeitlichen Geschichte (Sarnowsky, Rübsamen/Kuczera, Schildt, Staecker), 
eine ‚Online-Enzyklopädie’ (Lorenz/Krüger) und ‚Archive in der digitalen 
Welt‘ (Hering, Heckmann, Bischoff/Schäfer) wurden präsentiert und disku- 
tiert. Nach der Vorstellung der Projekte und wichtiger theoretischer, me- 
thodischer und praktischer Überlegungen für die Aufbereitung, Erhaltung 
und Bereitstellung von historischem Material und Publikationen für die 
Forschung bleibt danach zu fragen, welche Schlussfolgerungen aus dem 
Präsentierten gezogen werden können. 

Aus der Fülle der Themenbereiche, die dabei berührt wurden, sollen 
hier vier Punkte herausgestellt werden. Vorauszuschicken bleibt, dass die 
stark technik-orientierten Beiträge technisch weniger versierten Zuhörern 
deutlich machten, dass auf diesem Gebiet inzwischen ein Expertenwissen 
existiert, das nicht einfach zu erschließen ist. Ähnlich wie für die gebräuch- 
lichen Abkürzungen des 16. bis 18. Jahrhunderts wünschte man sich hier 
als Nichtexpertin für solche Vorträge ein Abkürzungsverzeichnis und eini- 
ge Erläuterungen. Gleichzeitig wurde jedoch auch dem naiven Benutzer 
digitaler Angebote eindringlich vor Augen geführt, dass eine Pioniergrup- 
pe hoch motivierter und nicht selten durch Doppelqualifikationen ausge- 
wiesener Historiker Quellen digitalisiert, Datenbanken und Fachportale 
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aufbaut sowie neue Medien für den Unterricht herstellt, während andere 
dieser Entwicklung noch distanziert bis ablehnend gegenüberstehen. Dass 
die Digitalisierung allerdings längst die Forschung beeinflusst, ohne dass 
ein eindeutiges Votum von Historikern und Archivaren zu dieser Entwick- 
lung bislang vorläge, haben auch die 2004 in Hamburg abgehaltene Tagung 
zum Thema Im Netz des Positivismus? Vom Nutzen und Nachteil des Internet 
für die historische Erkenntnis sowie ein im selben Jahr durchgeführter Work- 
shop in Fribourg (Schweiz) deutlich gemacht.’ 


1. Zum Wandel der Geschichtswissenschaft in der digitalen 
Welt 


In seinem einführenden Eingangsvortrag hat Thaller diesen schleichenden 
und bislang wenig reflektierten Veränderungsprozess, der durch das 
WWW und die neuen Medien ausgelöst wurde, angesprochen. Diese Ver- 
änderung bietet seiner Meinung nach zum ersten Mal die Möglichkeit zu 
einem radikalen Wandel der Geschichtswissenschaft. Ein solcher ‚Paradig- 
menwechsel‘, der diesen Namen wie keine andere Richtungsänderung in- 
nerhalb der historischen Wissenschaft verdienen würde, könnte eine Deka- 
nonisierung und die Auflösung asynchroner Arbeitsvorgänge mit sich brin- 
gen. Dies würde jedoch wiederum den radikalen Wandel des Selbstver- 
ständnisses von Archivaren, Bibliothekaren und Forschern sowie einen ko- 
operativen Arbeitsstil erfordern. Die vorgestellten Großprojekte zur Digita- 
lisierung mittelalterlicher und frühneuzeitlicher Quellen zeigen jedoch 
einen gegenteiligen Trend, die Kanonisierung wird mit diesen Unterneh- 
mungen eher verstärkt als abgebaut. Während auf der einen Seite Ge- 
schichtsschreibung also auch unter neuen technischen Möglichkeiten weit- 
gehend alten Mustern folgt, zeigt Thaller auf, dass auch das Festhalten an 
ehrwürdigen Traditionen letztlich nicht die bereits in Gang gesetzte Ände- 
rung der Welt der Wissenschaften aufhalten können wird. So werden zwar 
die benutzten Quellen und die eingearbeitete Literatur auch heute noch in 
einem so genannten wissenschaftlichen Apparat in Form von Fußnoten be- 


1 Vom Nutzen und Nachteil des Internet für die Historische Erkenntnis. Version 1.0. Hg. von An- 
gelika Epple und Peter Haber (Geschichte und Informatik, Histoire et Informatique 15). Zürich 
2005. 
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legt.” Diese Methode war ursprünglich auf einen kleinen elitären Gelehr- 
tenzirkel zugeschnitten, der mit den im 19. Jahrhundert edierten Quellen 
und der Forschungsliteratur vertraut war. Angesichts der Massenprodukti- 
on von wissenschaftlichen historischen Texten können die in den Fußnoten 
angegebenen Belege von uns nicht mehr vollständig nachvollzogen, ge- 
schweige denn kontrolliert werden. Kritische Studierende stellen deshalb 
nicht zu Unrecht Lehrenden häufig die Frage nach der Funktion und der 
Bedeutung von Fußnoten. Hier zeigt die von Staecker aufgestellte These, 
dass gerade in der Vernetzung die Chance der Digitalisate liegt, eine inter- 
essante Perspektive auf. Eine Verlinkung in der Fußnote auf die entspre- 
chende Textstelle in den Quellen bzw. in der Sekundärliteratur würde die 
Argumentation sowie Quellenbasis wissenschaftlicher Arbeiten in ganz 
neuer Weise nachvollziehbar machen und nachdrücklich zum wissen- 
schaftlichen Dialog auffordern. 

Wie sehr das WWW unsere Wissenschaft verändert hat, zeigt der Bei- 
trag von Lorenz/Krüger, der leider nicht für den Druck zur Verfügung 
stand. Die Einträge in der Online-Enzyklopädie werden von Wissenschaft- 
lern wie von Studierenden gleichermaßen häufig genutzt, obwohl die Frage 
nach der Autorenschaft und der Qualitätssicherung der dort abrufbaren 
Texte ungeklärt ist. Bei diesem Projekt, das mit aufklärerischer und demo- 
kratischer Zielsetzung angetreten ist, taucht wie bei den anderen vorge- 
stellten Großprojekten die Frage auf, wie und von wem wissenschaftliche 
Standards definiert werden sollen und ob ohne Institutionalisierung eine 
funktionierende Qualitätssicherung gewährleistet werden kann. 


2. Nachhaltigkeit/Finanzierbarkeit der Projekte 


Nahezu in allen Beiträgen kam die Frage nach der nachhaltigen Sicherung 
der digital bereit gestellten Materialien und der Zukunft der vorgestellten 
Projekte auf. Was will sich die Wissenschaftspolitik in Zukunft leisten, was 
kann sie sich leisten? Wieweit ist die Kommerzialisierung nötig? Bringt sie 
nur Nachteile mit sich oder birgt sie auch Chancen? Kann bei der anwach- 
senden Quantität von Digitalisierung und Katalogisierung eine gleichblei- 
bende Qualität garantiert werden? Wenn ‚work in progress’ sinnvoller Wei- 


? Anthony Grafton: Die tragischen Ursprünge der deutschen Fußnote. München 1998, bes. 
S. 13-47. 
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se veröffentlicht werden soll, wann ist dann eine elektronische Edition ab- 
geschlossen? Wer erklärt sie dazu? Wenn viele mitarbeiten können und sol- 
len, wer behält den Überblick? Wer schaltet Texte wann frei? Wie können 
Angebote zusammengeführt, Doppelarbeiten vermieden werden? Wie von 
Welck ankündigt, betrachtet die (Hamburger) Bildungspolitik die Bereit- 
stellung und die Bewahrung von Wissen als eine zentrale politische Aufga- 
be. Kooperationen werden für die Bewältigung dieser Aufgabe für notwen- 
dig erachtet, über das Finanzvolumen für derartige Vorhaben wurde nichts 
verraten. 

Sahle und Bischoff führen in diesem Themenbereich einige Grundüberle- 
gungen zu Techniken und Standards für die Erschließung historischer Do- 
kumente vor. Bischoff gibt die Devise aus, man müsse planmäßig, aber 
pragmatisch vorgehen. Die Archive scheinen bezüglich der Vernetzung - 
trotz der Föderalismusproblematik - in dieser Hinsicht einen Schritt weiter 
zu sein als die universitäre Geschichtsschreibung. Sahle weist darauf hin, 
wie dringend notwendig für die gewünschte Vernetzung eine klare Modu- 
larisierung des Informationsraums ist, die Input, Datenhaltung und Output 
klar voneinander trennt. Solche Vernetzungen werden im regionalen, im 
deutschen oder im internationalen Rahmen trotz aller Hindernisse von den 
vorgestellten mittelalterlichen und dem frühneuzeitlichen Projekt bereits 
hergestellt. 

Mit den von Thaller genannten circa 90 Pilotprojekten in Deutschland, 
die eine systematische Umsetzung großer Bestände von archivalischen 
Quellen und Bibliotheksbeständen anstreben, existieren also bereits viel- 
versprechende, inspirierende Ansätze für die weitere Vernetzung. Ob es 
dabei zur Revolutionierung der Geschichtswissenschaft kommen wird, 
muss sich noch zeigen. Wer wird diese Datenbanken und Digitalisate nut- 
zen, wer wird mit den Anbietern dieser Wissensräume in den interaktiven 
Dialog treten? Wird es zu einem neuen, kooperativen Arbeitsstil kommen? 
Wird neben den ‚klassischen‘ Quellen auch neues Material der Forschung 
online zugänglich gemacht, das von der Geschichtswissenschaft auf diesem 
Weg leichter entdeckt werden kann? Werden die aufbereiteten Daten und 
Texte auch für breitere Kreise in Zukunft lesbar und benutzbar sein? Auf 
welchen Rechnern werden die frühen Digitalisate zu lesen sein? Am priva- 
ten PC oder nur mehr im Museum für Technik? 
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3. Einzug eines neuen Positivismus? 


Eine in diesem Zusammenhang schon oft gestellte Frage wurde auch auf 
dieser Tagung diskutiert. Die von Heller und Vogeler mit großem Nach- 
druck vertretene Forderung, Informatikverfahren für die historische An- 
wendung im größerem Maßstab nutzbar zu machen, wirkt zunächst nicht 
zuletzt durch die von den Referenten deutlich gemachte Begeisterung für 
ihre vorgestellte Suche nach Problemlösungen faszinierend. Sicher bieten 
digitalisierte Texte der Forschung leichtere Zugänglichkeit und phantasti- 
sche Möglichkeiten für erzähltheoretische und philologische Fragestellun- 
gen. Wieweit ist jedoch die Informationsrecherche automatisierbar? Ist Text 
nicht doch mehr als eine Zeichenkette? Wird mit der angestrebten Form 
der Textaufbereitung nicht einem neuen Positivismus der Weg bereitet, 
wenn suggeriert wird, dass Historiker mit speziell für die Geschichtswis- 
senschaft entwickelten Suchmaschinen in den aufbereiteten Texten ‚sachli- 
chen Inhalt‘ finden könnten? Da Informationen niemals verlustfrei von ei- 
nem Medium in ein anderes transportiert werden können, ist auch danach 
zu fragen, welche Informationen bei der Digitalisierung verloren gehen 
werden. Wieweit kann, wie Hering fragt, die notwendige Kontextualisie- 
rung der Dokumente geleistet werden? Wird in absehbarer Zeit für die For- 
schung nur noch das existieren, was im WWW zu finden ist? 

Ähnliche Fragen tauchten auch nach dem Beitrag von C. Schäfer auf: Wie 
verträgt sich die Macht der Bilder - die im Übrigen das Geschichtsbewusst- 
sein breiter Bevölkerungsschichten schon heute weit eindringlicher prägt 
als gelehrte Texte — mit einer differenzierten Darstellung von Geschichte? 
Wie kann man eindrucksvolle Visualisierungen mit Problematisierung und 
Differenzierung verbinden? Auch hier wird zu beobachten sein, in welche 
Richtung die neuen Recherchemöglichkeiten und -strategien sowie Präsen- 
tationsformen die Geschichtswissenschaft verändern werden. 


4. Archive als „Gedächtnis der Gesellschaft“ 


Nicht nur die Geschichtswissenschaft, auch die Archive stehen vor techni- 
schen Herausforderungen und mentalen Umstellungen bei der Aufnahme 
von Archivgut. Die Entwicklung der Verwaltungen hin zum E-Government 
verlangen nach neuen Wegen der Archivierung. Die Arbeitsprozesse wer- 
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den sich verändern, Fragen der Benutzbarkeit und des Urheberrechts müs- 
sen bezüglich der neuen technischen Möglichkeiten berücksichtigt werden. 
Nicht zuletzt ist eine Anpassung und Weiterentwicklung der historischen 
Hilfswissenschaften an diesen Prozess erforderlich. Ein erstes ehrgeiziges 
europaweites Ziel ist die Online-Bereitstellung aller Findbücher. Ein ge- 
meinsames Portal für Archive, Bibliotheken und Museen in der Bundesre- 
publik ist in Vorbereitung. Ein Ziel bei der Digitalisierung wird die Scho- 
nung der Original-Bestände und die Steigerung der Effizienz bei der Er- 
schließung und der Bereitstellung des Archivguts sein. Auch hier stellt sich 
die Frage nach einheitlicher Software und einheitlichen Standards bei der 
Aufbereitung der Archivalien, um den Informationsaustausch und Konver- 
tierungen zu erleichtern und die Bestände nachhaltig zu sichern. 

Bei der Benutzerfreundlichkeit wurden große Unterschiede zwischen 
den Archiven deutlich. Während das Geheime Staatsarchiv in Berlin sei- 
nem Namen alle Ehre macht, sind andere Archive eher der Open-Access- 
Bewegung verpflichtet. Archivare, so die Prognose Bischoffs, werden sich 
zu Informationsbrokern entwickeln, nicht zuletzt deshalb, weil Archivaren 
keine Zeit mehr für die inhaltliche Erschließung der Archivalien bleiben 
wird. Ob sich Archive, wie Thaller meint, von Reisezielen zu Anbietern von 
Ressourcen wandeln werden, wird nicht zuletzt von Entscheidungen zum 
Urheberrecht und zu den Benutzergebühren abhängen. Deutlich wurde in 
der Abschlussdiskussion, dass für die anstehenden Aufgaben eine enge Zu- 
sammenarbeit zwischen Archivaren und Historikern nötig ist, um die Ar- 
chive für die Zukunft zu Orten des ‚gesellschaftlichen Gedächtnisses’ zu 
entwickeln. Die Tagung lieferte für diesen wissenschaftlichen Austausch 
erste wichtige Anstöße. 
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tet dort in den Projekten zvdd (Zentrales Verzeichnis digitalisierter Drucke) 
und OPAL (Online-Portal für digitalisierte Kulturgüter Niedersachsens). 

SARNOWSKY, Dr. Jürgen, geb. 1955, ist seit 1996 Professor für mittelalter- 
liche Geschichte an der Universität Hamburg. Seine Forschungsschwer- 
punkte sind die Bildungs- und Wissenschaftsgeschichte, Ordens- und 
Hanse-Geschichte, preußische und englische Geschichte. 

SCHÄFER, Dr. Christoph, geb. 1961. Der Historiker ist seit 2003 Professor 
für Alte Geschichte an der Universität Hamburg. Neben seinen For- 
schungsschwerpunkten im Hellenismus, zur Sozial- und Wirtschaftsge- 
schichte des Imperium Romanum und zu antiker Schifffahrt interessiert 
er sich besonders für digitalen Wissenstransfer. 

SCHÄFER, Dr. Udo, geb. 1959. Der Jurist und Archivar ist nach seiner Tä- 
tigkeit bei der staatlichen Archivverwaltung Baden-Württemberg seit 
2001 Amtsleiter des Staatsarchivs der Freien und Hansestadt Hamburg. 
Daneben ist er Vorsitzender der Arbeitsgruppe Archive und Recht der Ar- 
chivreferentenkonferenz des Bundes und der Länder. 

SCHASER, Dr. Angelika, geb. 1956, ist seit 2001 Professorin für Neuere Ge- 
schichte an der Universität Hamburg und leitete von 2003 bis 2005 das 
Teilprojekt Medienkompetenz im Grundstudium innerhalb des Projekts Geis- 
teswissenschaften im Internet. Sie ist Leiterin der ‚Arbeitsstelle für die digi- 
tale Edition neuzeitlicher Selbstzeugnisse‘ am Zentrum ‚Geisteswissen- 
schaften in der digitalen Welt‘ an der Universität Hamburg. 

SCHILDT, Dr. Bernd geb. 1948. Der Jurist ist Professor für Rechtsgeschichte 
und Bürgerliches Recht an der Ruhr-Universität Bochum. Schwerpunkt 
seiner wissenschaftlichen Arbeit ist die Erforschung der Rechtsprechung 
des Reichskammergerichts. 

STÄCKER, Dr. Thomas, geb. 1963, ist seit 1998 wissenschaftlicher Bibliothe- 
kar an der Herzog August Bibliothek Wolfenbüttel und Leiter der Abtei- 
lung Alte Drucke und Digitalisierung. Seine Arbeitsschwerpunkte sind 
‚Digitalisierung‘ und ‚Altes Buch‘. 
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THALLER, Dr. Manfred, geb. 1950. Der Historiker ist seit 2000 Professor für 
Informatik in den Geisteswissenschaften an der Universität zu Köln. Zu- 
vor war er am Max-Planck-Institut für Geschichte für das Arbeitsgebiet 
‚Historische Fachinformatik‘ verantwortlich. 

VOGELER, Dr. Georg, geb. 1969, ist wissenschaftlicher Mitarbeiter am 
Lehrstuhl für Geschichtliche Hilfswissenschaften der Ludwig-Maximi- 
lians-Universität München. Nach seiner Dissertation aus dem Bereich der 
Amtsbücherkunde arbeitet er zur Digitalisierung von mittelalterlichen 
Urkunden und stieß 2004 die Charters Encoding Initiative an. 

WELCK, Dr. Karin von, geb. 1947. Die Ethnologin und Honorarprofessorin 
der Universität Mannheim war Generalsekretärin der Kulturstiftung der 
Länder und ist seit März 2004 Präses der Kulturbehörde der Freien und 
Hansestadt Hamburg. 
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